Revista de Estudos da Linguagem (Dec 2015)

Anotação de Sentidos de Verbos em Textos Jornalísticos do Corpus CSTNews

  • Marco Antonio Sobrevilla Cabezudo,
  • Erick Galani Maziero,
  • Jackson Wilke da Cruz Souza,
  • Márcio de Souza Dias,
  • Paula Christina Figueira Cardoso,
  • Pedro Paulo Balage Filho,
  • Verônica Agostini,
  • Fernando Antônio Asevedo Nóbrega,
  • Cláudia Dias de Barros,
  • Ariani Di Felippo,
  • Thiago Alexandre Salgueiro Pardo

DOI
https://doi.org/10.17851/2237-2083.23.3.797-832
Journal volume & issue
Vol. 23, no. 3
pp. 797 – 832

Abstract

Read online

Um dos problemas mais difíceis de serem tratados no Processamento de Linguagem Natural (PLN) é a ambiguidade lexical, pois as palavras podem expressar sentidos distintos de acordo com o contexto no qual elas ocorrem. Em PLN, a tarefa responsável por determinar o sentido adequado de uma palavra em contexto é a Desambiguação Lexical de Sentido (DLS). Nessa tarefa, o uso de corpus anotado é muito útil, pois esse recurso linguístico computacional permite o estudo mais aprofundado da ambiguidade, assim como o desenvolvimento e a avaliação de métodos de DLS. O presente trabalho relata o processo de anotação de sentidos dos verbos em textos jornalísticos presentes no corpus CSTNews, usando-se a WordNet de Princeton como repositório de sentidos. As contribuições deste trabalho incluem a disponibilização de um recurso linguístico que serve de base para futuras pesquisas em DLS para o português, além de detalhar o processo de anotação e seus resultados.