Кібербезпека: освіта, наука, техніка (Mar 2020)

МЕТОД НЕЙРОМЕРЕЖЕВОГО АНАЛІЗУ ГОЛОСОВОГО СИГНАЛУ

  • Liudmyla Tereikovska

DOI
https://doi.org/10.28925/2663-4023.2020.7.3142
Journal volume & issue
Vol. 3, no. 7
pp. 31 – 42

Abstract

Read online

Стаття присвячена підвищенню ефективності засобів аналізу біометричних характеристик суб'єктів, що взаємодіють з інформаційно-управляючими системами різного призначення. Показано, що з позицій можливості застосування в якості сенсора зчитування біометричних параметрів стандартного периферійного обладнання комп'ютера, широкого використання в інформаційно-управляючих системах голосових повідомлень, їх високої інформативності, складності підробки біометричної інформації, а також можливості проведення прихованого моніторингу широкі перспективи мають засоби аналізу голосового сигналу. Обґрунтовано необхідність вдосконалення методології нейромережевого аналізу голосового сигналу для розпізнавання емоцій і особи Визначено можливість підвищення ефективності нейромережевих засобів аналізу за рахунок адаптації параметрів нейромережевої моделі до умов використання. Сформовано принципи визначення допустимих нейромережевих моделей і найбільш ефективного виду нейромережевої моделі, що використовується для аналізу голосового сигналу. Розроблено процедуру кодування вхідного сигналу, що дозволяє використовувати в нейронній мережі компактне представлення найбільш інформативних ознак голосового сигналу. Також розроблено процедура кодування вихідного сигналу нейронної мережі, що дозволяє підвищити ефективність її навчання. Розроблено метод нейромережевого аналізу голосового сигналу, який за рахунок запропонованих принципів адаптації і процедур кодування вхідних і вихідних параметрів, дозволяє впровадити в засоби розпізнавання нейронну мережу, архітектура якої адаптована до очікуваних умов застосування. Ефективність запропонованого методу доведено експериментальним шляхом. Проведені експериментальні дослідження показали, що використання розробленого методу дозволяє забезпечити точність розпізнавання емоцій ідентифікованого диктора, яка дорівнює приблизно 0.94, що відповідає кращим сучасним рішенням в даній області. Запропоновано співвіднести шляхи подальших досліджень з розробкою рішень, які дозволили б аналізувати голосовий сигнал довільної тривалості в умовах дії шуму різного виду.

Keywords