Вестник КазНУ. Серия математика, механика, информатика (Jan 2019)

Разработка единого метаязыка морфологии тюркских языков

  • А. Sharipbay,
  • A. Gatiatullin,
  • B. Yergesh,
  • D. Kazhymukhan

DOI
https://doi.org/10.26577/JMMCS-2018-4-557
Journal volume & issue
Vol. 100, no. 4
pp. 77 – 87

Abstract

Read online

В настоящее время в связи с резким увеличением объема информации на естественных языках в интернете и социальных сетях исследование и разработки в области вычислительной лингвистики становятся чрезвычайно актуальными. Как известно, вычислительная лингвистика является новым научным направлением и входит в состав вычислительной науки - информатики. Вычислительная лингвистика включает в себе компьютерную обработку естественных языков (ОЕЯ) – Natural Language Proccesing (NLP). Создание унифицированной системы разметки для тюркских языков (UniTurk) является актуальной задачей для обработки тюркских языков. Единая система разметок позволит унифицировать разметки, облегчить их понимание и использовать общее программное обеспечение, а также проводить различные исследования по лингво-статистическому сравнительному анализу среди тюркских языков. В статье представлены некоторые результаты, полученные в ходе выполнения запланированных работ над международным проектом по созданию многоязычной онтологии и единого метаязыка морфологии тюркских языков. С помощью онтологических моделей формализованы морфологические правила тюркских (казахского, киргизского, татарского, турецкого и узбекского) языков. Результат этих работ могут быть использованы для решения задач NLP, например, для разметка корпусов, в системах извлечения знаний, системах информационного поиска, машинного перевода и т.д.

Keywords