STEMMING EN ESPAí‘OL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Hugo Armando OrdoÃ±ez Eraso; Carlos Alberto Cobos Lozada

Revista UNIMAR (Apr 2014)

STEMMING EN ESPAí‘OL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Hugo Armando OrdoÃ±ez Eraso,
Carlos Alberto Cobos Lozada

Affiliations

Hugo Armando OrdoÃ±ez Eraso: Universidad Mariana
Carlos Alberto Cobos Lozada

Journal volume & issue: Vol. 29, no. 2

Abstract

Read online

La recuperación de información en internet, hoy en día se ha convertido enÂ una importante área de investigación, debido al crecimiento acelerado de lasÂ fuentes de información que en la web se encuentran. La investigación en esteÂ campo se ha centrado en crear mecanismos, métodos y herramientas comoÂ los algoritmos de stemming y los meta-buscadores, que optimizan la precisiónÂ en este tipo de tareas, mejorando así los resultados retornados al usuario queÂ utiliza el sistema. En este artículo se presenta y describe a nivel general, losÂ componentes de un algoritmo denominado Filtro Español, que permite realizarÂ stemming a documentos escritos en español en un sistema de búsqueda web. Este se diseña, con el fin de ampliar automáticamente la búsqueda a todasÂ las variaciones morfológicas de las palabras digitadas por los usuarios en lasÂ consultas y el contenido de los documentos. Para validar la eficiencia del analizador,Â se realizó un cálculo de similitud entre los documentos, aplicando elÂ método de n-gramas. La evaluación contempla la precisión del filtro donde los resultados de la primera valoración son interesantes.

Published in Revista UNIMAR

ISSN: 0120-4327 (Print); 2216-0116 (Online)
Publisher: Universidad Mariana
Country of publisher: Colombia
LCC subjects: General Works
Website: https://revistas.umariana.edu.co/index.php/unimar

About the journal