Ingeniería e Investigación (Jan 2012)

Estudio de conjuntos de datos desbalanceados usando un modelo asociativo con traslación de ejes

  • Laura Cleofas Sánchez,
  • Magali Guzmán Escobedo,
  • Rosa María Valdovinos Rosas,
  • Cornelio Yáñez Márquez,
  • Oscar Camacho Nieto

Journal volume & issue
Vol. 32, no. 1
pp. 53 – 57

Abstract

Read online

En diversos problemas de reconocimiento de patrones, se ha observado que el desequilibrio de clases puede disminuir el desempeño del clasificador, principalmente en los patrones de las clases minoritarias. Una estrategia para resolver el problema del desbalance, consiste en tratar por separado las clases incluidas en el problema (clase minoritaria o mayoritaria), a fin de equilibrar los conjuntos de datos. En este sentido, la motivación del presente artículo estriba en el hecho de que el modelo asociativo visto como Clasificador Híbrido Asociativo con Traslación (CHAT), es muy sensible al des-balance de las clases. Por ello, se analiza el impacto que los conjuntos de datos des-balanceados pueden tener sobre el rendimiento del CHAT. Adicionalmente, se analiza la conveniencia de utilizar métodos de bajo-muestreo para disminuir los efectos negativos que el modelo asociativo pueda sufrir. La viabilidad de este estudio se sustenta con los resultados experimentales obtenidos de once conjuntos de datos reales. Finalmente, el presente trabajo se considera como una investigación analítica-sintética.

Keywords