AVALIAÇÃO COMPARATIVA DE FAMÍLIAS WAVELET NA REDUÇÃO DE RUÍDO EM SINAIS DE VOZ CONTAMINADOS POR RUÍDO COLORIDO

Leandro Aureliano da Silva; Eduardo Silva Vasconcelos; Luiz  Fernando Ribeiro de Paiva; Welington Mrad Joaquim; Adriano  Dawison de Lima; Edilberto Pereira Teixeira

doi:10.47820/recima21.v7i4.7696

EVALUACIÓN COMPARATIVA DE FAMILIAS WAVELET EN LA REDUCCIÓN DE RUIDO EN SEÑALES DE VOZ CONTAMINADAS POR RUIDO COLOREADO

Autores/as

Leandro Aureliano da Silva Uniube/Engenharia

https://orcid.org/0000-0002-2050-2249

Eduardo Silva Vasconcelos Instituto Federal Goiano

https://orcid.org/0000-0002-7376-2386

Luiz Fernando Ribeiro de Paiva Uniube/Engenharia

https://orcid.org/0000-0001-5652-6421

Welington Mrad Joaquim Uniube/Engenharia

https://orcid.org/0000-0001-8364-0182

Adriano Dawison de Lima Uniube/Engenharia

https://orcid.org/0000-0002-2625-9083

Edilberto Pereira Teixeira Uniube/Engenharia

https://orcid.org/0000-0003-3953-2891

DOI

https://doi.org/10.47820/recima21.v7i4.7696

Palabras clave

Procesamiento de señales de voz , Transformada wavelet , reducción de ruido , mejora del habla (speech enhancement) , ruido coloreado

Publicado 10/04/2026 en la edición Vol. 7 Núm. 4 (2026) Sección ARTIGOS

Descargas

PDF (Portugués)

Estadísticas de descarga

Estadísticas no disponibles.

Resumen

La presencia de ruido en señales de voz constituye un desafío relevante en diversas aplicaciones de procesamiento digital de habla, incluyendo sistemas de comunicación, reconocimiento automático de voz y dispositivos de asistencia auditiva. En este contexto, las técnicas basadas en la transformada wavelet se han destacado debido a su capacidad de análisis multirresolución, permitiendo la descomposición de la señal en diferentes bandas de frecuencia y la separación eficiente entre componentes útiles y ruido. Este trabajo presenta una evaluación comparativa del desempeño de diferentes familias de wavelets en la reducción de ruido en señales de voz contaminadas por ruido coloreado. Se analizaron wavelets de las familias Daubechies, Symlet y Coiflet, utilizando descomposición hasta el tercer nivel y umbralización basada en el método rigrsure. Los experimentos se realizaron a partir de diez señales de voz limpia combinadas con diez realizaciones independientes de ruido coloreado, totalizando cien condiciones experimentales. El desempeño fue evaluado mediante las métricas SegSNR, STOI y la distancia de Itakura–Saito basada en LPC. Los resultados mostraron ganancias promedio cercanas a 3 dB en la relación señal-ruido segmentada después del proceso de denoising. Las wavelets Daubechies presentaron mayor ganancia en SegSNR, mientras que las Coiflet, especialmente la coif4, mostraron mejor desempeño global al equilibrar la reducción de ruido y la inteligibilidad. Las Symlet destacaron en la preservación del envolvente espectral. El análisis estadístico confirmó diferencias significativas, indicando que la elección depende de la aplicación.

Biografía del autor/a

Leandro Aureliano da Silva, Uniube/Engenharia

Doutor em Engenharia Elétrica pela UFU (2018) e mestre pela USP (2007), com especialização em Automação Industrial e graduação em Engenharia Elétrica. Atua em pesquisa, ensino e extensão nas áreas de IoT, automação, inteligência artificial e processamento de sinais. Possui experiência como docente e coordenador de cursos de engenharia e tecnologia na FACTHUS. Atualmente é professor e gestor de curso na UNIUBE e docente do Mestrado Profissional em Engenharia Química. Atua como editor científico, revisor e avaliador do BASIS/INEP.

Eduardo Silva Vasconcelos, Instituto Federal Goiano

Doutor em Ciências pela UFU, mestre em Matemática (UFG) e em Educação Superior (UNITRI). Graduado em Matemática, Administração e Gestão do Agronegócio, com diversas especializações e MBA em Gestão Pública. Atua na educação desde 1990 no ensino médio e desde 2003 no ensino superior, nas áreas de Matemática, Estatística e Gestão. Desde 2014, é Diretor-Geral do IF Goiano – Campus Cristalina. Possui experiência em gestão pública e desenvolvimento educacional.

Luiz Fernando Ribeiro de Paiva, Uniube/Engenharia

Doutor em Educação pela UNIUBE e mestre em Ciência da Informação pela PUC-Campinas. Possui especializações em Avaliação na Educação Superior (UnB) e Análise de Sistemas (UNAERP), além de aperfeiçoamento em Educação a Distância. É tecnólogo em Processamento de Dados pela UNIUBE. Atua como gestor de cursos de tecnologia (Sistemas de Informação, ADS, IA e Ciência de Dados e Ciência da Computação) na UNIUBE. Possui experiência em sistemas de informação, ensino superior e educação a distância, além de atuar como analista de sistemas.

Welington Mrad Joaquim, Uniube/Engenharia

Doutorando em Educação pela UNIUBE e mestre em Ensino de Ciências e Matemática (PUC Minas), com ênfase em Física. Possui diversas especializações em educação, tecnologias e ensino de ciências, além de formação multidisciplinar em Computação, Gastronomia, Engenharia Ambiental, Pedagogia, Matemática e Física. É professor da UNIUBE, atuando em cursos de Gastronomia, Engenharias e Licenciatura em Física, onde também exerce coordenação acadêmica. Possui experiência no ensino médio desde 2002 e na rede pública estadual de Minas Gerais desde 2017. Desenvolve atividades em ensino, formação docente, tecnologias educacionais e projetos interdisciplinares.

Adriano Dawison de Lima, Uniube/Engenharia

Graduado em Licenciatura em Matemática pela Universidade de Uberaba (2004), com mestrado (2006) e doutorado (2009) em Energia na Agricultura pela UNESP. Atua como docente em tempo integral na Universidade de Uberaba. Possui experiência em Matemática Aplicada, com ênfase em Álgebra Linear, Geometria Analítica e Cálculo. Trabalha também com Cálculo Numérico, Estatística Inferencial e Otimização de Sistemas. Desenvolve aplicações da matemática voltadas às Ciências Agrárias.

Edilberto Pereira Teixeira, Uniube/Engenharia

Graduado, mestre e doutor em Engenharia Elétrica pela UNIFEI e UNICAMP. Possui ampla experiência na área, com ênfase em sistemas elétricos de potência e controle de processos. Atua em temas como controle multivariável, sistemas não lineares, lógica nebulosa e redes neurais. Tem experiência também em eletricidade industrial. Atualmente é professor do curso de Engenharia Elétrica da Universidade de Uberaba (UNIUBE).

Referencias

BENESTY, J.; CHEN, J.; HUANG, Y. Microphone Array Signal Processing. Berlin: Springer, 2008.

DAUBECHIES, I. Ten Lectures on Wavelets. Philadelphia: Society for Industrial and Applied Mathematics (SIAM), 1992. Disponível em: https://epubs.siam.org/doi/book/10.1137/1.9781611970104 DOI: https://doi.org/10.1137/1.9781611970104

DEMŠAR, J. Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, v. 7, p. 1–30, 2006. Disponível em: https://jmlr.org/papers/v7/demsar06a.html Acesso em: 13 mar. 2026.

DONOHO, D.; JOHNSTONE, I. Adapting to unknown smoothness via wavelet shrinkage. Journal of the American Statistical Association, v. 90, n. 432, p. 1200–1224, 1995. Disponível em: https://doi.org/10.1080/01621459.1995.10476626 Acesso em: 13 mar. 2026. DOI: https://doi.org/10.1080/01621459.1995.10476626

IQBAL, Y. et al. A hybrid speech enhancement technique based on discrete wavelet transform and spectral subtraction. [S. l.: s. n.], 2025. Disponível em: https://ieeexplore.ieee.org/document/10906581 Acesso em: 13 mar. 2026 DOI: https://doi.org/10.1109/ACCESS.2025.3546434

ITAKURA, F.; SAITO, S. Analysis synthesis telephony based on the maximum likelihood method. In: International Congress on Acoustics, 1970. Disponível em: https://ieeexplore.ieee.org/document/1164317 Acesso em: 13 mar. 2026.

LOIZOU, P. Speech Enhancement: Theory and Practice. 2. ed. Boca Raton: CRC Press, 2013. DOI: https://doi.org/10.1201/b14529

MALLAT, S. A Wavelet Tour of Signal Processing: The Sparse Way. 3. ed. New York: Academic Press, 2009.

TAAL, C. et al. A short-time objective intelligibility measure for time-frequency weighted noisy speech. IEEE Transactions on Audio, Speech and Language Processing, v. 19, n. 7, p. 2125–2136, 2011. Disponível em: https://doi.org/10.1109/TASL.2011.2114881 Acesso em: 13 mar. 2026. DOI: https://doi.org/10.1109/TASL.2011.2114881

VASEGHI, S. Advanced Digital Signal Processing and Noise Reduction. 4. ed. Chichester: Wiley, 2008. Disponível em: https://doi.org/10.1002/9780470740156 Acesso em: 13 mar. 2026. DOI: https://doi.org/10.1002/9780470740156

WU, Z. T. et al. Improving speech enhancement models using discrete wavelet transform features. Electronics, v. 14, n. 7, 2025. Disponível em: https://www.mdpi.com/2079-9292/14/7/1354 Acesso em: 13 mar. 2026. DOI: https://doi.org/10.3390/electronics14071354

YOUSIF, S. T. et al. Speech enhancement algorithms: a systematic literature review. Algorithms, v. 18, n. 5, 2025. Disponível em: https://www.mdpi.com/1999-4893/18/5/272 Acesso em: 13 mar. 2026. DOI: https://doi.org/10.3390/a18050272

Licencia

Derechos de autor 2026 RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.

Os direitos autorais dos artigos/resenhas/TCCs publicados pertecem à revista RECIMA21, e seguem o padrão Creative Commons (CC BY 4.0), permitindo a cópia ou reprodução, desde que cite a fonte e respeite os direitos dos autores e contenham menção aos mesmos nos créditos. Toda e qualquer obra publicada na revista, seu conteúdo é de responsabilidade dos autores, cabendo a RECIMA21 apenas ser o veículo de divulgação, seguindo os padrões nacionais e internacionais de publicação.

Cómo citar

Aureliano da Silva, L., Silva Vasconcelos, E., Fernando Ribeiro de Paiva, L. ., Mrad Joaquim, W., Dawison de Lima, A., & Pereira Teixeira, E. (2026). EVALUACIÓN COMPARATIVA DE FAMILIAS WAVELET EN LA REDUCCIÓN DE RUIDO EN SEÑALES DE VOZ CONTAMINADAS POR RUIDO COLOREADO. RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218, 7(4), e747696. https://doi.org/10.47820/recima21.v7i4.7696

Descargar cita