Вестник музыкальной науки (Apr 2021)

Использование онтологий в работе с полнотекстовыми базами данных

  • Бажанов, Николай Сергеевич

DOI
https://doi.org/10.24411/2308-1031-2020-10075
Journal volume & issue
Vol. 2021, no. 4 (30)
pp. 165 – 174

Abstract

Read online

В статье рассматривается поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, которые представляют собой коллекцию текстовых документов в одной научной области. Наибольший объем содержания статьи раскрывает технологический контекст полнотекстового поиска, рассматриваются и анализируются те взаимосвязанные в системе поиска структуры, которые влияют на результат поиска информации. В качестве инструмента, организующего такой поиск, избраны онтологические описания. Понятие онтологии используется в прикладном, а не в философском значении, как спецификация сущности вещей. Важной стороной онтологий является «концептуализация» предметного знания, вне учета которого полнотекстовой поиск будет всегда ограничен. Фактически задача поиска в больших полнотекстовых базах данных создать такое взаимодействие компьютерных алгоритмов и интеллекта исследователя, которое перевело бы поиск из простых, разовых, законченных действий в непрерывное наполнение сложного, составного знания о научной проблеме. В статье анализируется соотношение смыслов поиска и языковых слов, используемых в запросе. Разделение понятий смысл и слово придает поиску более совершенную форму, выводя на первое и ведущее место смыслы поиска посредством ведомых вербальных форм. Также рассматриваются важные свойства поиска: концентрация найденных смыслов, новизна искомого знания, замкнутость и открытость результатов. На основании изучения особенностей работы и поиска в полнотекстовых базах данных автор приходит к следующим выводам. Возможности поиска и работы с полнотекстовыми базами данных никогда не используются полностью. Совершенствование информационно-поисковой системы всегда актуально. Чем более концентрированы в полнотекстовой базе данных научные смыслы и одна тематика дисциплины, тем больше возможностей ее функционирования в виде базы знаний и экспертной системы. Поиск в полнотекстовой базе данных представляет собой открытую систему: одновременно снимая одни вопросы, он добавляет новые, тем самым делая поиск непрерывным «интеллектуально-системным» познанием научной проблемы.

Keywords