BRAC (Jun 2013)
Discriminación de Sentidos Basada en Análisis Estadístico de Textos
Abstract
Durante a.os han existido programas que de manera autom.tica obtienen informaci.n acerca de entidades como personas, organizaciones o conceptos científicos a partir de repositorios de texto en formato digital tales como la Web u otras fuentes. Sin embargo, todav.a existe una serie de dificultades que no se han podido resolver, por ejemplo cuando distintas entidades son designadas con un mismo nombre (como el rat.n, que puede ser un dispositivo periférico en computación o bien un mam.fero). El presente artículo propone un método para resolver este problema basado en el análisis de la frecuencia de las palabras que se encuentran en el contexto de aparición de la palabra ambigua. Cada uno de los sentidos de una palabra polisémica se representan mediante los correspondientes grupos de otras unidades léxicas que muestran tendencia a aparecer en el contexto de esta palabra. El interés de esta propuesta reside en que no requiere ning.n tipo de conocimiento externo al corpus, como conocimiento del mundo o de la lengua de los textos.
Keywords