Revista UIS Ingenierías (Jun 2011)
Algoritmos de expansión de consulta basados en una nueva función discreta de relevancia
Abstract
Se ha demostrado que el proceso de expansión de las consultas en el modelo espacio vectorial de representación dedocumentos en un sistema de recuperación de información, es una técnica útil para mejorar la relevancia medidapor la precisión de los resultados entregados a los usuarios. En este artículo se presenta un nuevo algoritmo y unavariación del mismo para realizar expansión de consultas en un sistema de recuperación de información. Estosalgoritmos se basan en una nueva función discreta que define la importancia relativa de un término en una colecciónde documentos. El algoritmo y su variación se evalúan frente a la búsqueda por similitud de cosenos y el algoritmode expansión propuesto por Rocchio, obteniendo excelentes resultados sobre la colección de datos CACM (artículospublicados en la revista Communications of the ACM).