Una herramienta computacional para el agrupamiento de datos basado en el comportamiento colectivo de las abejas
Fecha
2016-09Autor
Perozo, Niriaska
Gutiérrez, Oscar
Pérez, Raúl
Metadatos
Mostrar el registro completo del ítemResumen
En el ámbito de la minería de datos y el aprendizaje de máquina no supervisado, la agrupación de datos es definido como la tarea de agrupar objetos de acuerdo con una medida de similitud o disimilitud. Esto es, los objetos que son similares entre sí, se reúnen en el mismo grupo, y los que son disímiles se organizan en diferentes grupos, a partir de lo cual, puede emerger una estructura descriptiva de los datos. En las ciencias sociales, la clasificación y agrupamiento de individuos respecto a patrones de comportamiento puede dar lugar a descripciones y predicciones cuantitativas que permitan un estudio más preciso de cómo funcionan las sociedades bajo ciertos parámetros como por ejemplo: la predicción de un comportamiento emergente de la delincuencia en algunos sectores sociales. En general, el problema de agrupamiento puede formularse con la optimización de multi-objetivos, la cual puede ser muy compleja en términos de tiempo y espacio, en términos computacionales. En este sentido, el algoritmo de colonia de abejas, perteneciente al área de la inteligencia de enjambre y basado en la optimización numérica, intenta obtener la mejor solución al problema, explotando y explorando el espacio de búsqueda. En este trabajo se propone una herramienta computacional implementada en Java para simular el comportamiento de los enjambres de abejas como un sistema multi-agentes, en el cual es posible observar la agrupación en los datos de prueba que se utilizan para ajustar los parámetros clave y comparar los resultados obtenidos con trabajos similares. A través de la experimentación realizada, se propone utilizar el algoritmo de optimización de enjambre de partículas, como una técnica heurística para obtener mejores soluciones iniciales en el agrupamiento de datos, de tal manera que el algoritmo de colonia de abejas pueda converger a un óptimo global, mejorando su velocidad de convergencia In the field of data mining and unsupervised machine learning, data clustering is defined as the task of grouping objects according to a similarity or dissimilarity measure. That means, objects that are similar among them are grouped in the same cluster, and objects that are dissimilar are grouped into different clusters so a data descriptive structure can emerge. In social sciences, the classification and the grouping regarding to behavior patterns can take place to quantitative descriptions and predictions which let more specific study about how societies work under some parameters such as prediction of a crime emergent behavior in some social sectors. In general, the clustering problem can be formulated as a multi-objective optimization problem, which can be very complex in time and space computationally speaking. In this sense, the Artificial Bee Colony Algorithm which is a swarm intelligence algorithm based on numeric optimization, tries to get the best solution to the problem, exploiting and exploring the search space. In this work, we propose a computationally tool implemented in java for simulating the behavior of the honey bee swarms as a multi-agent system, where it is possible to observe the data clustering in training data that is used to tune the key parameters and compare them with similar papers. Through this experimentation, it is proposed to use the particle swarm optimization algorithm as a heuristic technique to get better initial solutions to the problem, so that the ABC algorithm can converge to a global optimum improving its convergence rate.