Studia z Filologii Polskiej i Słowiańskiej (Dec 2014)

Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości

  • Zofia Rudnik-Karwatowa

DOI
https://doi.org/10.11649/sfps.2014.006
Journal volume & issue
Vol. 49

Abstract

Read online

Multilingual information retrieval system of Slavic linguistics iSybislaw: challenges, achievements and opportunities In multilingual information retrieval (IR) system iSybislaw we introduce a number of solutions enlarging its efficiency and effectiveness with the main tool, which presents the keyword language. In this paper the applicability and consistency of the accepted approach in the presentation of the content of documents and IR is being discussed. We use natural language (professional language based on linguistic terminology) in the construction of the keyword language and implementation of the tools of semantic organization and access to multilingual informational database. The core task is to make allowance in the retrieval database for relations of equivalence between the keywords in different Slavic languages and in the English language, which will enable the simultaneous search in different languages. Implementation of the natural language enables optimization of the IR language but on the other hand it creates problems connected with synonymy and polysemy of the terms used as keywords. Such problems are being solved with implementation of the classes of equivalent keywords, pairs and more complicated units of monosemantic keywords presenting the terms linked with each other by semantic relations. Burst-type increase of written documents in the field of linguistics requires taking effort in speeding up the processing of the growing number of repre­sentations of these documents into search database. So we decided to call upon the users (the authors of the works considered in the system) to take part in creation of the IR language in the iSybislaw system through tagging. Wielojęzyczny system informacyjno-wyszukiwawczy językoznawstwa slawistycznego iSybislaw: wyzwania, osiągnięcia i możliwości Zgodnie z koncepcją użytkownikami wielojęzycznego systemu iSybislaw są przede wszystkim językoznawcy slawiści, w mniejszym zakresie badacze języków niesłowiańskich, historycy, literaturoznawcy. Budowany system informacji bibliograficznej powinien więc zaspokajać potrzeby informacyjne tej grupy specjalistów. W systemie iSybislaw zastosowano szereg rozwiązań umożliwiających zwiększenie jego efektywności i sprawności podstawowego narzędzia informacyjno-wyszukiwawczego, jakim jest język słów kluczowych. W artykule przedstawiona została przydatność i spójność przyjętej metodologii w opisie treści dokumentów i wyszukiwaniu informacji, czyli wykorzystanie języka naturalnego (języka specjalistycznego opartego na terminologii językoznawczej) do budowy języka słów kluczowych, oraz zastosowanie narzędzi semantycznej organizacji i dostępu do wielojęzycznego zasobu informacyjnego. Zadaniem kluczowym jest uwzględnienie w zbiorze wyszukiwawczym relacji równoważności (ekwiwalencji) między słowami kluczowymi z różnych języków słowiańskich, a także z języka angielskiego, co umożliwi przeszukiwanie jednocześnie w wielu językach. Wykorzystanie języka naturalnego daje możliwości optymalizacji języka informacyjno-wyszukiwawczego, ale z drugiej strony stwarza problemy związane z synonimicznością i wieloznacznością terminów, przetwarzanych w słowa kluczowe. Problemy takie są rozwiązywane poprzez stosowanie klas ekwiwalentnych słów kluczowych oraz par lub więcej jednoznacznych słów kluczowych reprezentujących terminy, połączone ze sobą relacją znaczeniową (pojęć). Lawinowy przyrost piśmiennictwa z dziedziny językoznawstwa wymaga usprawnienia działań przyspieszających proces opracowywania coraz większego zbioru opisów tych dokumentów do zbioru wyszukiwawczego. Dlatego podjęliśmy decyzję włączenia autorów prac uwzględnianych w systemie do współtworzenia języka informacyjno-wyszukiwawczego w systemie iSybislaw poprzez możliwość tagowania.

Keywords