Revista Cubana de Ciencias Informáticas (Jun 2018)

Reparación Compatible en Almacenes de Datos Inconsistentes

  • Juan-José Ramírez,
  • Raúl Arredondo,
  • Cristian Vallejos

Journal volume & issue
Vol. 12, no. 2
pp. 15 – 29

Abstract

Read online

Una dimensión, en un almacén de datos, es un concepto abstracto que agrupa datos que comparten un significado semántico común. Las dimensiones se modelan mediante un esquema jerárquico de categorías. Una dimensión es llamada estricta si cada elemento de cada categoría tiene exactamente un ancestro en cada categoría superior, y homogénea si cada elemento de una categoría tiene por lo menos un ancestro en cada categoría superior. Si una dimensión es estricta y homogénea se pueden utilizar consultas pre-computadas en los niveles inferiores para obtener respuestas en los niveles superiores. Sin embargo, cuando las dimensiones no son estrictas/homogéneas debemos conocer sus restricciones para obtener un resultado correcto. En el mundo real, las dimensiones pueden no satisfacer estas restricciones, y en estos casos, es importante corregir estas dimensiones o encontrar formas de obtener respuestas correctas a las preguntas planteadas en las dimensiones inconsistentes. Una reparación minimal es una nueva dimensión que satisface las restricciones estrictas y homogéneas, y que se obtiene a partir de la dimensión original a través de un número mínimo de cambios, la cual tiene un costo computacional NP-duro. Para mejorar esto, se define la dimensión extendida y se propone la reparación compatible que obtiene una nueva dimensión consistente, manteniendo la esencia de la dimensión original. En este último punto se centra la experimentación, elaborando y evaluando un programa que genere esta reparación compatible y obtenga resultados en tiempo polinomial.

Keywords