Metody statystyczne w komputerowym przetwarzaniu języka naturalnego

Piotr Malak

doi:10.12775/TSB.2011.003

Toruńskie Studia Bibliologiczne (May 2011)

Metody statystyczne w komputerowym przetwarzaniu języka naturalnego

Piotr Malak

Affiliations

Piotr Malak: Uniwersytet Mikołaja Kopernika, Toruń

DOI: https://doi.org/10.12775/TSB.2011.003
Journal volume & issue: Vol. 4, no. 1 (6)
pp. 49 – 62

Abstract

Read online

Artykuł wprowadza w problematykę wykorzystania metod statystycznych w komputerowym przetwarzaniu tekstów języka naturalnego. Została w nim zaprezentowana lingwistyka kwantytatywna oraz jednostki tekstu podlegające badaniom statystycznym. Przyjęte definicje jednostek leksykalnych poddane zostały dyskusji ze względu na ich przydatność w komputerowym, statystycznym przetwarzaniu języka naturalnego, z uwzględnieniem różnic terminologicznych występujących w polsko- i angielskojęzycznej literaturze przedmiotu. Omówione zostały również cechy statystyczne jednostek leksykalnych oraz kategorie i miary stosowane do ich badań kwantytatywnych.

Published in Toruńskie Studia Bibliologiczne

ISSN: 2080-1807 (Print)
Publisher: Wydawnictwo Naukowe Uniwersytetu Mikołaja Kopernika
Country of publisher: Poland
LCC subjects: Bibliography. Library science. Information resources
Website: https://apcz.umk.pl/TSB/index

About the journal

Abstract

Keywords