Revista Principia (Feb 2018)

Classificação de disfonias por meio da análise de medidas não lineares e de quantificação de recorrência

  • Giulliana Karla Lacerda Pereira de Queiroz,
  • Silvana Luciene do Nascimento Cunha Costa,
  • Suzete Élida Nóbrega Correia,
  • Vinícius Jefferson Dias Vieira,
  • Leonardo Wanderley Lopes

DOI
https://doi.org/10.18265/1517-03062015v1n38p148-160
Journal volume & issue
Vol. 1, no. 38
pp. 148 – 160

Abstract

Read online

Nos últimos anos, técnicas de processamento digital de sinais de voz vêm sendo empregadas como ferramentas auxiliares na avaliação de desvios vocais, trazendo maior comodidade ao paciente, baixo custo e caráter objetivo, comparado às técnicas tradicionalmente empregadas, como a análise perceptivo-auditiva. A avaliação da qualidade vocal, por análise acústica de sinais de voz, se constitui cada vez mais em prática clínica para detecção de distúrbios vocais que, em alguns casos, podem ser ocasionados por lesões laríngeas ou abuso vocal. Nesta pesquisa, foram empregadas algumas medidas não lineares tradicionais, combinadas com medidas de quantificação de recorrência, para a análise discriminativa dos desvios vocais rugosidade, soprosidade e tensão. As características da análise dinâmica não linear, abordadas para o processo de classificação, foram o Passo de Reconstrução (t), o Primeiro Mínimo da Função de Informação Mútua (PM) e a Dimensão de correlação (D2). As medidas de quantificação empregadas foram: Determinismo (Det), Entropia de Shannon (Entr), Comprimento médio das linhas diagonais (Lmed), Comprimento máximo das linhas verticais (Vmax) e Transitividade (Trans). Por meio de testes estatísticos, foi avaliado o potencial de cada característica em discriminar os tipos de sinais de voz considerados. No processo de classificação, foi utilizada a rede neural MLP (Multilayer Perceptron), com algoritmo de aprendizado supervisionado Scheduling Conjugate Graded (SCG). Obteve-se uma acurácia média de 90% na discriminação entre vozes saudáveis e desviadas. Na classificação entre vozes saudáveis e tensas, obteve-se uma acurácia média de 76%, com as medidas combinadas Trans, t, Vmax, Lmed, Det e D2. Na detecção do desvio rugosidade, obteve-se uma acurácia média de 89% com as medidas Lmed, Entr, Trans e D2 e, na distinção entre as vozes saudáveis e soprosas, obteve-se 91,17% com apenas duas medidas combinadas Trans e t, demonstrando o caráter promissor da técnica empregada.

Keywords