DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada (Dec 2014)

Uso de corpora comparáveis para filtrar dicionários bilíngues gerados por transitividade

  • Pablo GAMALLO

DOI
https://doi.org/10.1590/0102-445034728151307539
Journal volume & issue
Vol. 30, no. 2
pp. 213 – 235

Abstract

Read online

Este artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso método.

Keywords