Mostrar el registro sencillo del ítem
Detection of Bot Accounts in a Twitter Corpus: Author Profiling of Social Media Users as Human vs. Nonhuman
dc.contributor.author | Díaz Torres, María José | |
dc.contributor.author | Rico-Sulayes, Antonio | |
dc.date.accessioned | 2024-06-05T16:13:05Z | |
dc.date.available | 2024-06-05T16:13:05Z | |
dc.date.issued | 2021 | |
dc.identifier.govdoc | ppi2011ME3945 | |
dc.identifier.issn | 2244-811X | |
dc.identifier.uri | http://bdigital2.ula.ve:8080/xmlui/654321/14516 | |
dc.description.abstract | This paper presents a successful series of experiments on the detection of SPAMBOTS in Twitter, based on the use of linguistic features. For these experiments, we built a small corpus and classified its contents with the help of human annotators, who achieved a high rate of agreement. We identified linguistic features previously tested in the literature and adapted them to the language and contents of our database. High accuracy, (90%), was achieved in the spambot detection task. Our best results were obtained with a very small feature set produced with automatic reduction techniques. This outcome supports our contention that feature reduction is crucial in text classification tasks. All experiments were conducted by means of software packages with GUIs that do not require programming skills. Our results highlight the fact that language experts can, with a little training, utilize their knowledge and expertise in the very important fight against malicious technologies. | en_US |
dc.description.abstract | Este artículo presenta una exitosa serie de experimentos sobre la detección de BOTS DE SPAM en Twitter, que parten del uso de características lingüísticas. Para estos experimentos, construimos un corpus de corta extensión y clasificamos su contenido con la ayuda de anotadores humanos, quienes alcanzaron un alto nivel de acuerdo. Identificamos características lingüísticas probadas previamente en la literatura y las adaptamos al idioma y al contenido de nuestra base de datos. De esta manera, se obtuvieron resultados de exactitud prometedores, (90%), en la tarea de detección de bots. Nuestros mejores resultados se lograron con un conjunto de rasgos muy limitado, producido con técnicas de reducción automática. Estos resultados apoyan la idea de que la reducción de rasgos es crucial en las tareas de clasificación de texto. Más aún, todos los experimentos se llevaron a cabo usando paquetes de software con interfaces gráficas que no requieren de conocimientos de programación. Esto muestra que los expertos en el lenguaje tienen conocimientos y experiencia que, con un poco de entrenamiento, pueden aplicar en la importante lucha contra las tecnologías maliciosas | en_US |
dc.language.iso | en | en_US |
dc.publisher | Universidad de Los Andes | en_US |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/ve/ | en_US |
dc.subject | author profiling | en_US |
dc.subject | bot detection | en_US |
dc.subject | machine learning | en_US |
dc.subject | spambots | en_US |
dc.subject | en_US | |
dc.subject | perfilado del autor | en_US |
dc.subject | detección de bots | en_US |
dc.subject | aprendizaje automático | en_US |
dc.subject | spambots | en_US |
dc.title | Detection of Bot Accounts in a Twitter Corpus: Author Profiling of Social Media Users as Human vs. Nonhuman | en_US |
dc.type | Article | en_US |