Revista Cubana de Ciencias Informáticas (Apr 2012)
Método para el aprendizaje de reglas de clasificación para conjuntos de datos no balanceados
Abstract
En este artículo, se estudia el desempeño del algoritmo IRBASIR-D, obtenido a partir del algoritmo IRBASIR (Inducción de Reglas Basado en Relaciones de Similaridad) para el caso de conjuntos de datos no balanceados. El uso de relaciones de similaridad permite aplicar este método en el caso de datos mixtos (rasgos con dominios discretos o continuos). Los resultados experimentales muestran un desarrollo satisfactoria del algoritmo IRBASIR-D comparado con otros como C4.5 con los conjuntos de datos originales y editados con SMOTE, SMOTE-ENN y variantes de estos métodos sensibles al costo.