COMPARATIVE EVALUATION OF WAVELET FAMILIES IN NOISE REDUCTION OF SPEECH SIGNALS CONTAMINATED BY COLORED NOISE
Abstract
Noise contamination in speech signals represents a significant challenge in several speech processing applications, including communication systems, automatic speech recognition, and hearing assistance devices. In this context, wavelet-based techniques have been widely used due to their multiresolution analysis capability, allowing signal components to be separated across different frequency scales. This work presents a comparative evaluation of different wavelet families for speech denoising under colored noise conditions. Wavelets from the Daubechies, Symlet, and Coiflet families were analyzed using wavelet decomposition up to level three and thresholding based on the rigrsure (Stein's Unbiased Risk Estimate) method. The experiments were conducted using ten clean speech signals combined with ten independent realizations of colored noise, resulting in one hundred experimental conditions. The performance of the methods was evaluated using Segmental Signal-to-Noise Ratio (SegSNR), Short-Time Objective Intelligibility (STOI), and Itakura–Saito distance based on LPC. The results showed an average improvement of approximately 3 dB in SegSNR after the denoising process. Wavelets from the Daubechies family achieved higher SegSNR gains, while Coiflet wavelets, particularly coif4, showed the best overall performance when considering both noise reduction and speech intelligibility preservation. On the other hand, Symlet wavelets, such as sym3, demonstrated better preservation of the spectral envelope of the speech signal. Statistical analysis using the Friedman test confirmed significant differences among the evaluated wavelets. The results indicate that the optimal wavelet choice depends on the specific objective of the application.
Author Biographies
Doutor em Engenharia Elétrica pela UFU (2018) e mestre pela USP (2007), com especialização em Automação Industrial e graduação em Engenharia Elétrica. Atua em pesquisa, ensino e extensão nas áreas de IoT, automação, inteligência artificial e processamento de sinais. Possui experiência como docente e coordenador de cursos de engenharia e tecnologia na FACTHUS. Atualmente é professor e gestor de curso na UNIUBE e docente do Mestrado Profissional em Engenharia Química. Atua como editor científico, revisor e avaliador do BASIS/INEP.
Doutor em Ciências pela UFU, mestre em Matemática (UFG) e em Educação Superior (UNITRI). Graduado em Matemática, Administração e Gestão do Agronegócio, com diversas especializações e MBA em Gestão Pública. Atua na educação desde 1990 no ensino médio e desde 2003 no ensino superior, nas áreas de Matemática, Estatística e Gestão. Desde 2014, é Diretor-Geral do IF Goiano – Campus Cristalina. Possui experiência em gestão pública e desenvolvimento educacional.
Doutor em Educação pela UNIUBE e mestre em Ciência da Informação pela PUC-Campinas. Possui especializações em Avaliação na Educação Superior (UnB) e Análise de Sistemas (UNAERP), além de aperfeiçoamento em Educação a Distância. É tecnólogo em Processamento de Dados pela UNIUBE. Atua como gestor de cursos de tecnologia (Sistemas de Informação, ADS, IA e Ciência de Dados e Ciência da Computação) na UNIUBE. Possui experiência em sistemas de informação, ensino superior e educação a distância, além de atuar como analista de sistemas.
Doutorando em Educação pela UNIUBE e mestre em Ensino de Ciências e Matemática (PUC Minas), com ênfase em Física. Possui diversas especializações em educação, tecnologias e ensino de ciências, além de formação multidisciplinar em Computação, Gastronomia, Engenharia Ambiental, Pedagogia, Matemática e Física. É professor da UNIUBE, atuando em cursos de Gastronomia, Engenharias e Licenciatura em Física, onde também exerce coordenação acadêmica. Possui experiência no ensino médio desde 2002 e na rede pública estadual de Minas Gerais desde 2017. Desenvolve atividades em ensino, formação docente, tecnologias educacionais e projetos interdisciplinares.
Graduado em Licenciatura em Matemática pela Universidade de Uberaba (2004), com mestrado (2006) e doutorado (2009) em Energia na Agricultura pela UNESP. Atua como docente em tempo integral na Universidade de Uberaba. Possui experiência em Matemática Aplicada, com ênfase em Álgebra Linear, Geometria Analítica e Cálculo. Trabalha também com Cálculo Numérico, Estatística Inferencial e Otimização de Sistemas. Desenvolve aplicações da matemática voltadas às Ciências Agrárias.
Graduado, mestre e doutor em Engenharia Elétrica pela UNIFEI e UNICAMP. Possui ampla experiência na área, com ênfase em sistemas elétricos de potência e controle de processos. Atua em temas como controle multivariável, sistemas não lineares, lógica nebulosa e redes neurais. Tem experiência também em eletricidade industrial. Atualmente é professor do curso de Engenharia Elétrica da Universidade de Uberaba (UNIUBE).
References
BENESTY, J.; CHEN, J.; HUANG, Y. Microphone Array Signal Processing. Berlin: Springer, 2008.
DAUBECHIES, I. Ten Lectures on Wavelets. Philadelphia: Society for Industrial and Applied Mathematics (SIAM), 1992. Disponível em: https://epubs.siam.org/doi/book/10.1137/1.9781611970104
DEMŠAR, J. Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, v. 7, p. 1–30, 2006. Disponível em: https://jmlr.org/papers/v7/demsar06a.html Acesso em: 13 mar. 2026.
DONOHO, D.; JOHNSTONE, I. Adapting to unknown smoothness via wavelet shrinkage. Journal of the American Statistical Association, v. 90, n. 432, p. 1200–1224, 1995. Disponível em: https://doi.org/10.1080/01621459.1995.10476626 Acesso em: 13 mar. 2026.
IQBAL, Y. et al. A hybrid speech enhancement technique based on discrete wavelet transform and spectral subtraction. [S. l.: s. n.], 2025. Disponível em: https://ieeexplore.ieee.org/document/10906581 Acesso em: 13 mar. 2026
ITAKURA, F.; SAITO, S. Analysis synthesis telephony based on the maximum likelihood method. In: International Congress on Acoustics, 1970. Disponível em: https://ieeexplore.ieee.org/document/1164317 Acesso em: 13 mar. 2026.
LOIZOU, P. Speech Enhancement: Theory and Practice. 2. ed. Boca Raton: CRC Press, 2013.
MALLAT, S. A Wavelet Tour of Signal Processing: The Sparse Way. 3. ed. New York: Academic Press, 2009.
TAAL, C. et al. A short-time objective intelligibility measure for time-frequency weighted noisy speech. IEEE Transactions on Audio, Speech and Language Processing, v. 19, n. 7, p. 2125–2136, 2011. Disponível em: https://doi.org/10.1109/TASL.2011.2114881 Acesso em: 13 mar. 2026.
VASEGHI, S. Advanced Digital Signal Processing and Noise Reduction. 4. ed. Chichester: Wiley, 2008. Disponível em: https://doi.org/10.1002/9780470740156 Acesso em: 13 mar. 2026.
WU, Z. T. et al. Improving speech enhancement models using discrete wavelet transform features. Electronics, v. 14, n. 7, 2025. Disponível em: https://www.mdpi.com/2079-9292/14/7/1354 Acesso em: 13 mar. 2026.
YOUSIF, S. T. et al. Speech enhancement algorithms: a systematic literature review. Algorithms, v. 18, n. 5, 2025. Disponível em: https://www.mdpi.com/1999-4893/18/5/272 Acesso em: 13 mar. 2026.
