Сучасний стан наукових досліджень та технологій в промисловості (Aug 2023)

ОНТОЛОГО-КЕРОВАНІ ЗАСОБИ ОБРОБЛЕННЯ ТА ПОДАННЯ ВЕЛИКИХ МАСИВІВ НЕСТРУКТУРОВАНИХ ТЕКСТІВ

  • Svitlana Haiko

DOI
https://doi.org/10.30837/ITSSI.2023.24.027
Journal volume & issue
no. 2(24)

Abstract

Read online

Предметом дослідження статті є методи онтолого-керованого оброблення та подання неструктурованих текстів у глобальному середовищі. Мета роботи – підвищення ефективності автоматичного пошуку, класифікації та вибору необхідної інформації, що міститься в електронних виданнях у неструктурованій формі шляхом розроблення моделі, методу й засобів автоматизованого оброблення та трансдисциплінарного подання текстових документів, створених українською, російською та англійською мовами. Відповідно до мети визначено такі завдання: розглянути моделі оброблення та подання неструктурованих текстів; виявити переваги інформаційних систем з онтолого-керованою архітектурою; розробити концептуальну модель і засоби автоматизованого оброблення та трансдисциплінарного подання текстових документів; удосконалити метод рекурсивної редукції; за допомогою розроблених методів і засобів обробити великий масив неструктурованих текстів (зокрема інформаційну базу знань наукової продукції (ІБЗ НП), навчальні програми, а також навчально-дослідницькі проєкти НЦ "Мала академія наук України"); подати їх у вигляді, що дасть змогу виявляти якість і повноту наявної в базах системи знань і, отже, експериментально підтвердити ефективність розроблених засобів. Проведені дослідження ґрунтуються на таких методах: системологічної класифікації, алгебро-логічний та аксіоматичний методи, метод рекурсивної редукції. Здобуто такі результати: описано наявні моделі оброблення та подання неструктурованих текстів; удосконалено технологічні аспекти онтолого-керованого підходу до оброблення та подання великих масивів мережних документів; розроблено технологію формування онтологій документів на основі репрезентації їх таксономій, зв’язків між їх контекстами та множинного подання, що забезпечує ефективний пошук інформації в неструктурованих текстах. Висновки: обґрунтовано переваги онтолого-керованих засобів оброблення та подання неструктурованих текстів; подальшого розвитку набув метод рекурсивної редукції шляхом побудови перетворення, яке приводить до предикативної форми онтологічно задані описи інформації; викладено ідеї ефективного пошуку, оброблення, класифікації та вибору необхідної інформації.

Keywords