Revista Española de Documentación Científica (Sep 1998)
Evaluación del rendimiento de tesauros españoles en sistemas de recuperación de información
Abstract
El artículo describe un estudio experimental desarrollado en bases de datos españolas en el que se establece la comparación del rendimiento entre diferentes tesauros y el lenguaje natural, en el proceso de recuperación de la información. El test se llevó a cabo mediante la combinación de los métodos analítico y de muestreo y validación de datos. Las consultas se realizaron de modo interactivo, evaluándose los registros y modificándose las estrategias a la vista de los resultados. Las referencias recuperadas en cada modalidad se valoraron en base a las tasas de precisión y exhaustividad. Los resultados muestran que en lenguaje libre se consiguió una precisión del 63,4 % y una exhaustividad del 59,5 %; con la ayuda del tesauro ambos índices mejoraron: en precisión se alcanzó un 86,8 % y en exhaustividad un 61,6 %. Se concluye que el lenguaje controlado consigue más bajos niveles de ruido que el libre al tiempo que puede llegar a aportar tan altos índices de exhaustividad como aquél; igualmente, a la vista de los resultados de la comparación se puede concluir que el lenguaje controlado neutraliza las deficiencias del libre y viceversa y, por tanto, ambos son complementarios.
Keywords