Mìkrosistemi, Elektronìka ta Akustika (Oct 2019)

Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою

  • Anastasiia Olehivna Harasiuk,
  • Maksym Volodymyrovych Myronov,
  • Vladyslav Valentynovych Lozinsky,
  • Nguyen Thanh Vy,
  • Alla Vitaliivna Darchuk,
  • Arkadii Mykolaiovych Prodeus

DOI
https://doi.org/10.20535/2523-4455.2019.24.5.192893
Journal volume & issue
Vol. 24, no. 5

Abstract

Read online

Результати акустичної експертизи приміщень та засобів зв’язку, що полягає в оцінюванні розбірливості мовних сигналів, є необхідними для сертифікації приміщень та комунікаційних систем. Оскільки технічні засоби звукоінженерів постійно змінюються й удосконалюються, а також з огляду на зростання переліку факторів, що можуть бути врахованими при оцінюванні розбірливості мови, зростає й кількість апаратно-програмних додатків для такого оцінювання. Таким чином, розробка математичного та програмного забезпечення для прогнозування та вимірювання розбірливості мови є актуальним завданням. Найбільш поширеними на сьогодні є формантний та модуляційний методи оцінювання розбірливості мови. Формантний метод є дещо обмеженим, оскільки не дозволяє враховувати дію реверберації. Модуляційний метод, в якому мірою оцінювання розбірливості мови є індекс передачі мови (Speech Transmission Index), є вільним від цього недоліку. Тому в деяких роботах можна зустріти висловлювання про «застарілість» формантного методу. Проте, ретельне зіставлення потенційних можливостей формантного та модуляційного методів свідчить, що формантний метод перевершує свого конкурента за точністю і швидкістю обчислень в умовах, коли дія шуму переважає над дією реверберації. Найбільшого поширення набули такі версії формантного методу оцінювання розбірливості мови як індекс артикуляції (Articulation Index) й індекс розбірливості мови (Speech Intelligibility Index). На території колишнього СРСР найбільш поширеними були версії формантного методу, розвинуті в наукових школах, очолюваних Н. Б. Покровським, М. А. Сапожковим і Ю. С. Биковим. Згідно із формантним методом, область частот мовного сигналу розбивають на суміжні частотні смуги, в межах кожної з яких спектри мови та шуму можна вважати практично незмінними, й формантну розбірливість обчислюють як певну функцію парціальних відношень сигнал-шум, а словесну розбірливість обчислюють через формантну розбірливість. У даній статті представлено детальний опис алгоритму прогнозування розбірливості мови шляхом аналітичного моделювання. У загальному вигляді алгоритм складається з наступних кроків: на першому етапі обчислень здійснюється формування первинних моделей мовного сигналу і шуму у вигляді масивів вибірок стаціонарних випадкових процесів із заданими спектральними характеристиками. Потім виконується корекція дисперсій цих модельних процесів, щоб забезпечити необхідне інтегральне відношення сигнал-шум. Після такої корекції оцінюються парціальні відношення сигнал-шум. На заключному етапі обчислюються показники розбірливості мови, такі як формантна розбірливість, словесна розбірливість, індекс передачі мови. Працездатність запропонованого алгоритму перевірена для 4-х видів шумової завади: білої, рожевої, коричневої та типової для навчальних приміщень. Узгодженість отриманих результатів з відомими аналогічними результатами свідчить про коректність запропонованих компонентів аналітичного алгоритму. Окрім того, виконано співставлення результатів оцінювання розбірливості мови, отриманих у відповідності до «класичного» підходу, з результатами оцінювання індексу передачі мови, що дозволило підтвердити тезу про низьку маскувальну здатність білого шуму при малих відношеннях сигнал-шум. Запропонований в даній роботі алгоритм прогнозування розбірливості мови буде корисним студентам в галузі звукоінженерії, фахівцям в галузях розробки та налагодження систем зв’язку, архітектурного проектування, озвучення залів різного призначення, а також керівникам установ, де розбірливість мови є важливим показником.

Keywords