Linguamática (Apr 2010)

Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação

  • Hugo Gonçalo Oliveira,
  • Diana Santos,
  • Paulo Gomes

Journal volume & issue
Vol. 2, no. 1

Abstract

Read online

Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constituído por relações entre palavras, extraídas de forma automática de um dicionário da língua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações incluídas e a sua quantidade. Apresentamos também uma primeira avaliação, que tomou duas formas: para as relações de sinonímia, a comparação com o TeP 2.0, um recurso publicamente acessível e de cobertura vasta; para as outras relações, interrogando corpos em português. Esta segunda forma pode ser efectuada automaticamente, ou recorrendo a avaliadores. Nesta última vertente, integrado no projecto AC/DC, é oferecido mais um serviço de validação de relações à comunidade do processamento computacional da língua portuguesa, onde qualquer utilizador pode actuar como avaliador.