Вестник КазНУ. Серия математика, механика, информатика (Dec 2017)

Идентификация языка в системе поиска аудиоинформации по ключевым словам на казахском языке в многоязыковой среде

  • Zh. Kozhirbayev,
  • Zh. Yessenbayev,
  • А. Sharipbay

Journal volume & issue
Vol. 96, no. 4
pp. 88 – 98

Abstract

Read online

Обработка больших данных в настоящее время является одной из важнейших задач ИТ- индустрии, а аудиоматериалы рассматриваются как один из основных источников этих данных. Следовательно, наряду с увеличением объема аудиоинформации, необходимо со- здать эффективные информационно-поисковые системы для аудиоматериалов (STD). Так как аудио данные могут быть на разных языках, тут предстоит распознавать язык в аудио. Автоматическая идентификация языка (LID) рассматривается как задача, которая автома- тически различает язык, на котором говорят в речевом образце. Современный прогресс в обработке сигналов, таких как распознавание образов, машинное обучение и нейронные се- ти, повышает производительность LID. В этой работе мы применили новейшие технологии рекуррентных нейронных сетей (RNN) с долгой краткосрочной памятью (LSTM) к исход- ным аудиофункциям, чтобы идентифицировать звуковые образцы на казахском языке. Сети LSTM рассматриваются как тип RNN, который использует специальные единицы вместе со стандартными. Кроме того, блоки LSTM состоят из «ячейки памяти», которая может хра- нить информацию в памяти в течение длительных периодов времени. STD система может отбирать аудиоматериалы на казахском языке с помощью LID и тем самым не тратить вы- числительные ресурсы на аудио данных на других языках. В этой работе мы показываем результаты для автоматизированного распознавания речи, определения голосовых терминов и экспериментов по иденти

Keywords