Ingeniare: Revista Chilena de Ingeniería (Dec 2012)
Separación ciega de fuentes no-determinada aplicada a mezclas de voz con base en la transformada wavelet discreta Undetermined blind source separation of speech mixtures based on discrete wavelet transform
Abstract
La separación ciega de fuentes, conocida como BSS por sus siglas en inglés (Blind Source Separation), es una técnica de procesamiento de señales que consiste en estimar fuentes en señales mezcladas linealmente, utilizando métodos como el ICA, para señales fuentes estadísticamente independientes. Uno de los algoritmos BSS más conocidos es el algoritmo JADE, el cual exige que el número de señales independientes coincida con el número de señales observadas (sensores). En situaciones reales, el número de sensores es menor al número de señales fuentes (BSS no-determinado) y el problema no tiene solución. En este proyecto se propone una solución para BSS no-determinado, adicionando una etapa de preprocesamiento y una etapa de descomposición basada en la transformada wavelet discreta. Nuestro modelo, el cual hemos denominado DWT+BSS, crea una señal virtual observada a partir de una señal real observada y utiliza los coeficientes wavelet de las señales observadas como entradas al algoritmo clásico JADE. El modelo se valida con señales de voz y audio, obteniendo índices de similitud entre las señales fuentes y las estimadas por encima de 0,7.Blind Source Separation, BSS, is a signal processing technique which estimates sources from linearly mixed signals and it uses methods such as ICA for sources that are statistically independent. Among the best known BSS algorithms is the JADE method, which requires that the number of independent signals match the number of observed signals (sensors). In the real world, the number of sensors is lower than the number of sources (undetermined BSS) and therefore the problem has no solution. This work proposes a solution for undetermined BSS by pre-processing and decomposition stages based on the Discrete Wavelet Transform (DWT). Our proposal, which it is known as DWT+BSS, creates a virtual observed signal from a real observed signal and it uses the wavelet coefficients of the observed signals as the inputs of the classical JADE algorithm. We validated our model with voice and audio signals obtaining indexes of similarity over 0.7 between the original and the estimated sources.