Cognitive Studies | Études cognitives (Dec 2016)

Mention Detection for Coreference Resolution in Polish. Development of the Formal Grammar

  • Alicja Wójcicka,
  • Mateusz Kopeć

DOI
https://doi.org/10.11649/cs.2016.012
Journal volume & issue
no. 16

Abstract

Read online

Mention Detection for Coreference Resolution in Polish. Development of the Formal Grammar This paper presents the results of an improvement and extension of the Shallow Grammar of Polish, designed for the needs of the Computer-based Methods for Coreference Resolution in Polish Texts (CORE) project. The role of the Grammar was to detect nominal groups (i.e. multi-level nested phrases) that could be considered as mentions in coreference resolution tasks. In this article, the reorganization and changes to the Grammar are described, as well as the results of an evaluation of the Polish Coreference Corpus with manual annotations of mentions and coreferential expressions. A comparison of the second version of the Grammar with an evaluation of the first version reveals an improvement to the recall and F1 measures. Parsing płytki relacji koreferencji w języku polskim. Rozwój gramatyki formalnej Celem artykułu jest przedstawienie rezultatów prac zmierzających do rozszerzenia gramatyki powierzchniowej języka polskiego, stworzonej na potrzeby projektu "Komputerowe metody identyfikacji nawiązań w tekstach polskich" (grant NCN nr 6505/B/T02/2011/40), oraz poprawy wyników jej działania. Rolą gramatyki powierzchniowej jest wykrywanie grup nominalnych, które mogą wchodzić w relację koreferencji z innymi wyrażeniami w tekście. Nowa gramatyka została przetestowana z użyciem Polskiego Korpusu Koreferencyjnego, w którym grupy nominalne oraz relacje koreferencji między nimi zostały oznaczone ręcznie. Porównanie nowej wersji gramatyki z wersją poprzednią wykazało poprawę zarówno skuteczności wykrywania odpowiednich grup, jak i wzrost miary F1.

Keywords