Revista de Estudos da Linguagem (Dec 2015)

Extração de relações hiponímicas em um corpus de língua portuguesa

  • Pablo Neves Machado,
  • Vera Lúcia Strube de Lima

DOI
https://doi.org/10.17851/2237-2083.23.3.599-640
Journal volume & issue
Vol. 23, no. 3
pp. 599 – 640

Abstract

Read online

As relações hiponímicas são importantes na construção de estruturas de conhecimento, tais como ontologias ou taxonomias, para melhorar o processo de busca. O presente trabalho estuda em detalhe padrões para extração de relações hiponímicas com base em um corpus de língua portuguesa. Para tanto, toma como base os padrões específicos propostos por Hearst (1992), Freitas e Quental (2007) e Taba e Caseli (2014). Constrói, a partir desses padrões, regras que alimentam um protótipo, o qual as aplica a um corpus e extrai, como resultado, relações hiponímicas. Avaliadores humanos avaliam as relações extraídas, utilizando a escala proposta por Freitas e Quental. A precisão das extrações é compatível com as da literatura. O trabalho ainda apresenta um minucioso estudo quanto à produtividade dos padrões e quanto à avaliação das extrações.

Keywords