Detection of Bot Accounts in a Twitter Corpus: Author Profiling of Social Media Users as Human vs. Nonhuman

Díaz Torres, María José; Rico-Sulayes, Antonio

dc.contributor.author	Díaz Torres, María José
dc.contributor.author	Rico-Sulayes, Antonio
dc.date.accessioned	2024-06-05T16:13:05Z
dc.date.available	2024-06-05T16:13:05Z
dc.date.issued	2021
dc.identifier.govdoc	ppi2011ME3945
dc.identifier.issn	2244-811X
dc.identifier.uri	http://bdigital2.ula.ve:8080/xmlui/654321/14516
dc.description.abstract	This paper presents a successful series of experiments on the detection of SPAMBOTS in Twitter, based on the use of linguistic features. For these experiments, we built a small corpus and classified its contents with the help of human annotators, who achieved a high rate of agreement. We identified linguistic features previously tested in the literature and adapted them to the language and contents of our database. High accuracy, (90%), was achieved in the spambot detection task. Our best results were obtained with a very small feature set produced with automatic reduction techniques. This outcome supports our contention that feature reduction is crucial in text classification tasks. All experiments were conducted by means of software packages with GUIs that do not require programming skills. Our results highlight the fact that language experts can, with a little training, utilize their knowledge and expertise in the very important fight against malicious technologies.	en_US
dc.description.abstract	Este artículo presenta una exitosa serie de experimentos sobre la detección de BOTS DE SPAM en Twitter, que parten del uso de características lingüísticas. Para estos experimentos, construimos un corpus de corta extensión y clasificamos su contenido con la ayuda de anotadores humanos, quienes alcanzaron un alto nivel de acuerdo. Identificamos características lingüísticas probadas previamente en la literatura y las adaptamos al idioma y al contenido de nuestra base de datos. De esta manera, se obtuvieron resultados de exactitud prometedores, (90%), en la tarea de detección de bots. Nuestros mejores resultados se lograron con un conjunto de rasgos muy limitado, producido con técnicas de reducción automática. Estos resultados apoyan la idea de que la reducción de rasgos es crucial en las tareas de clasificación de texto. Más aún, todos los experimentos se llevaron a cabo usando paquetes de software con interfaces gráficas que no requieren de conocimientos de programación. Esto muestra que los expertos en el lenguaje tienen conocimientos y experiencia que, con un poco de entrenamiento, pueden aplicar en la importante lucha contra las tecnologías maliciosas	en_US
dc.language.iso	en	en_US
dc.publisher	Universidad de Los Andes	en_US
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/ve/	en_US
dc.subject	author profiling	en_US
dc.subject	bot detection	en_US
dc.subject	machine learning	en_US
dc.subject	spambots	en_US
dc.subject	Twitter	en_US
dc.subject	perfilado del autor	en_US
dc.subject	detección de bots	en_US
dc.subject	aprendizaje automático	en_US
dc.subject	spambots	en_US
dc.title	Detection of Bot Accounts in a Twitter Corpus: Author Profiling of Social Media Users as Human vs. Nonhuman	en_US
dc.type	Article	en_US

Ficheros en el ítem

Nombre:: articulo5.pdf
Tamaño:: 227.2Kb
Formato:: PDF

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

Vol. 25: Enero - Diciembre (2021)

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como http://creativecommons.org/licenses/by-nc-sa/3.0/ve/