Linguamática (Dec 2016)
Visão Geral da Avaliação de Similaridade Semântica e Inferência Textual
Abstract
Inferência Textual e Similaridade Semântica são duas tarefas do processamento de línguas naturais que tratam de pares de trechos de textos. O objetivo da primeira é determinar se o significado de um trecho implica o outro, enquanto que a segunda atribui uma pontuação de similaridade semântica ao par. Esse artigo apresenta os resultados da avaliação conjunta ASSIN (Avaliação de Similaridade Semântica e Inferência) e seu corpus, que foi anotado para ambas as tarefas nas variantes brasileira e europeia da língua portuguesa. O corpus difere de similares na literatura em suas três classes para a tarefa de inferência textual (Implicação, Paráfrase e Neutro) e por ter sido composto de sentenças extraídas de textos jornalísticos. Seis equipes participaram da avaliação conjunta, explorando diferentes estratégias.