Dissertare: Revista de Investigación en Ciencias Sociales (Dec 2016)
Una Herramienta computacional para el agrupamiento de datos basado en el comportamiento colectivo de las abejas
Abstract
En el ámbito de la minería de datos y el aprendizaje de máquina no supervisado, la agrupación de datos es definido como la tarea de agrupar objetos de acuerdo con una medida de similitud o disimilitud. Esto es, los objetos que son similares entre sí, se reúnen en el mismo grupo, y los que son disímiles se organizan en diferentes grupos, a partir de lo cual, puede emerger una estructura descriptiva de los datos. En las ciencias sociales, la clasificación y agrupamiento de individuos respecto a patrones de comportamiento puede dar lugar a descripciones y predicciones cuantitativas que permitan un estudio más preciso de cómo funcionan las sociedades bajo ciertos parámetros como por ejemplo: la predicción de un comportamiento emergente de la delincuencia en algunos sectores sociales. En general, el problema de agrupamiento puede formularse con la optimización de multi-objetivos, la cual puede ser muy compleja en términos de tiempo y espacio, en términos computacionales. En este sentido, el algoritmo de colonia de abejas, perteneciente al área de la inteligencia de enjambre y basado en la optimización numérica, intenta obtener la mejor solución al problema, explotando y explorando el espacio de búsqueda. En este trabajo se propone una herramienta computacional implementada en Java para simular el comportamiento de los enjambres de abejas como un sistema multi-agentes, en el cual es posible observar la agrupación en los datos de prueba que se utilizan para ajustar los parámetros clave y comparar los resultados obtenidos con trabajos similares. A través de la experimentación realizada, se propone utilizar el algoritmo de optimización de enjambre de partículas, como una técnica heurística para obtener mejores soluciones iniciales en el agrupamiento de datos, de tal manera que el algoritmo de colonia de abejas pueda converger a un óptimo global, mejorando su velocidad de convergencia.