Mìkrosistemi, Elektronìka ta Akustika (Oct 2019)
Прогнозоване оцінювання розбірливості мови, замаскованої шумовою завадою
Abstract
Результати акустичної експертизи приміщень та засобів зв’язку, що полягає в оцінюванні розбірливості мовних сигналів, є необхідними для сертифікації приміщень та комунікаційних систем. Оскільки технічні засоби звукоінженерів постійно змінюються й удосконалюються, а також з огляду на зростання переліку факторів, що можуть бути врахованими при оцінюванні розбірливості мови, зростає й кількість апаратно-програмних додатків для такого оцінювання. Таким чином, розробка математичного та програмного забезпечення для прогнозування та вимірювання розбірливості мови є актуальним завданням. Найбільш поширеними на сьогодні є формантний та модуляційний методи оцінювання розбірливості мови. Формантний метод є дещо обмеженим, оскільки не дозволяє враховувати дію реверберації. Модуляційний метод, в якому мірою оцінювання розбірливості мови є індекс передачі мови (Speech Transmission Index), є вільним від цього недоліку. Тому в деяких роботах можна зустріти висловлювання про «застарілість» формантного методу. Проте, ретельне зіставлення потенційних можливостей формантного та модуляційного методів свідчить, що формантний метод перевершує свого конкурента за точністю і швидкістю обчислень в умовах, коли дія шуму переважає над дією реверберації. Найбільшого поширення набули такі версії формантного методу оцінювання розбірливості мови як індекс артикуляції (Articulation Index) й індекс розбірливості мови (Speech Intelligibility Index). На території колишнього СРСР найбільш поширеними були версії формантного методу, розвинуті в наукових школах, очолюваних Н. Б. Покровським, М. А. Сапожковим і Ю. С. Биковим. Згідно із формантним методом, область частот мовного сигналу розбивають на суміжні частотні смуги, в межах кожної з яких спектри мови та шуму можна вважати практично незмінними, й формантну розбірливість обчислюють як певну функцію парціальних відношень сигнал-шум, а словесну розбірливість обчислюють через формантну розбірливість. У даній статті представлено детальний опис алгоритму прогнозування розбірливості мови шляхом аналітичного моделювання. У загальному вигляді алгоритм складається з наступних кроків: на першому етапі обчислень здійснюється формування первинних моделей мовного сигналу і шуму у вигляді масивів вибірок стаціонарних випадкових процесів із заданими спектральними характеристиками. Потім виконується корекція дисперсій цих модельних процесів, щоб забезпечити необхідне інтегральне відношення сигнал-шум. Після такої корекції оцінюються парціальні відношення сигнал-шум. На заключному етапі обчислюються показники розбірливості мови, такі як формантна розбірливість, словесна розбірливість, індекс передачі мови. Працездатність запропонованого алгоритму перевірена для 4-х видів шумової завади: білої, рожевої, коричневої та типової для навчальних приміщень. Узгодженість отриманих результатів з відомими аналогічними результатами свідчить про коректність запропонованих компонентів аналітичного алгоритму. Окрім того, виконано співставлення результатів оцінювання розбірливості мови, отриманих у відповідності до «класичного» підходу, з результатами оцінювання індексу передачі мови, що дозволило підтвердити тезу про низьку маскувальну здатність білого шуму при малих відношеннях сигнал-шум. Запропонований в даній роботі алгоритм прогнозування розбірливості мови буде корисним студентам в галузі звукоінженерії, фахівцям в галузях розробки та налагодження систем зв’язку, архітектурного проектування, озвучення залів різного призначення, а також керівникам установ, де розбірливість мови є важливим показником.
Keywords