APPLICATION OF MACHINE LEARNING MODELS IN THE CONTEXT OF BOLSA FAMÍLIA: AN APPLIED STUDY IN RIO GRANDE DO NORTE AND PARAÍBA

Luiz Fernando da Cunha Silva; Maria Eduarda Bandeira Hora de Vasconcelos; Verônica Maria Lima Silva; Samara Martins Nascimento Gonçalves

doi:10.47820/recima21.v7i6.8077

APLICACIÓN DE MODELOS DE APRENDIZAJE MÁQUINA EN EL CONTEXTO DE BOLSA FAMÍLIA: UN ESTUDIO APLICADO EN RIO GRANDE DO NORTE Y PARAÍBA

Autores/as

Luiz Fernando da Cunha Silva Universidade Federal Rural do Semi-Árido (UFERSA)

https://orcid.org/0009-0007-7953-3561

Maria Eduarda Bandeira Hora de Vasconcelos Universidade Federal da Paraíba (UFPB)

https://orcid.org/0009-0008-9644-3071

Verônica Maria Lima Silva Universidade Federal da Paraíba (UFPB)

https://orcid.org/0000-0002-8980-6910

Samara Martins Nascimento Gonçalves Universidade Federal Rural do Semi-Árido (UFERSA)

DOI

https://doi.org/10.47820/recima21.v7i6.8077

Palabras clave

Aprendizaje automático. Administración pública. Bolsa Família.

Publicado 27/05/2026 en la edición Vol. 7 Núm. 6 (2026) Sección ARTIGOS

Descargas

PDF (Inglés)

Estadísticas de descarga

Estadísticas no disponibles.

Resumen

Este estudio investiga la aplicación de técnicas de aprendizaje automático para apoyar la toma de decisiones en la administración pública, centrándose en la predicción de la elegibilidad familiar para el Programa Bolsa Família en los estados brasileños de Rio Grande do Norte y Paraíba. Se utilizaron microdatos anonimizados de la base de datos Cadastro Único (2016–2018) para entrenar y evaluar modelos predictivos. Tras el preprocesamiento de datos, el balanceo de clases con la técnica Synthetic Minority Over-sampling Technique y la reducción de dimensionalidad mediante SelectKBest, se implementaron cinco modelos de aprendizaje automático: K-Nearest Neighbors, Support Vector Machine, Random Forest, XGBoost y una red neuronal recurrente. Los resultados muestran que los modelos basados en árboles, las redes neuronales y las máquinas de vectores de soporte logran un rendimiento robusto en ambos estados, con valores de precisión de hasta el 90 %. Random Forest, XGBoost y las redes neuronales recurrentes fueron más estables en RN, mientras que la máquina de vectores de soporte logró el mejor rendimiento en PB, lo que indica diferencias regionales en la separabilidad de los datos. La selección de características redujo eficazmente la complejidad del modelo sin pérdida de precisión, destacando los ingresos, la estructura familiar, el acceso a servicios básicos y el tamaño de la familia como determinantes clave de la elegibilidad.

Biografía del autor/a

Luiz Fernando da Cunha Silva, Universidade Federal Rural do Semi-Árido (UFERSA)

Posee licenciatura en Sistemas de Información por la Universidade Federal Rural do Semi-Árido (UFERSA). Actúa como investigador colaborador en el Instituto Tecnológico de Aeronáutica (ITA) en el área de investigación espacial y participa en proyectos de investigación en la Universidade Federal Rural do Semi-Árido (UFERSA) y en la Universidade Federal da Paraíba (UFPB), incluidos Women in STEM y DATALAB. Sus principales áreas de interés incluyen Ciencia de Datos, Inteligencia Artificial, Aprendizaje Automático, Sistemas Inteligentes y Desarrollo de Sistemas.

Maria Eduarda Bandeira Hora de Vasconcelos, Universidade Federal da Paraíba (UFPB)

Estudiante de pregrado en Ciencia de Datos e Inteligencia Artificial en la Universidade Federal da Paraíba (UFPB). Posee conocimientos en programación con Python, JavaScript y C/C++. Desarrolla proyectos que ofrecen soluciones relevantes mediante el análisis de datos reales y la aplicación de modelos de aprendizaje automático. Tiene interés en las áreas de inteligencia artificial, bases de datos y pruebas de software.

Verônica Maria Lima Silva, Universidade Federal da Paraíba (UFPB)

Posee licenciatura en Ingeniería de Computación por la Universidade Federal do Ceará (2011). Desde 2015, se desempeña como profesora en la Universidade Federal Rural do Semi-Árido (UFERSA) y obtuvo el título de Doctora en Ingeniería Eléctrica por la Universidade Federal de Campina Grande (UFCG) en 2019. Sus áreas de investigación incluyen sistemas digitales, convertidores analógico-digitales, convertidores de información analógica, sistemas embebidos e inteligencia artificial.

Samara Martins Nascimento Gonçalves, Universidade Federal Rural do Semi-Árido (UFERSA)

Posee doctorado en Ciencia de la Computación por la Universidade Federal do Ceará. Es Profesora Asociada de la Universidade Federal Rural do Semi-Árido (UFERSA) y una de las líderes de los grupos de investigación del Laboratorio de Innovaciones en Software (LIS). Sus principales áreas de investigación incluyen Bases de Datos, Big Data, Flujos de Datos, Bases de Datos NoSQL, Data Warehousing, Gestión de Datos, Análisis de Sistemas, Calidad de Software y Métricas de Software.

Referencias

ALSHEHHI, K.; CHEAITOU, A.; RASHID, H. Adoption Frameworks for Artificial Intelligence in the Public Sector: A Systematic Review of Literature. Proc. 3rd South Amer. Int. Ind. Eng. Oper. Manag. Conf, [s. l.], p. 919–929, 2022. DOI 10.46254/SA03.20220211. Disponível em: https://doi.org/10.46254/SA03.20220211 Acesso em: 8 abr. 2026.

AZEVEDO, C. S.; GONÇALVES, R. F.; GAVA, V. L.; SPINOLA, M. M. A Benford’s Law Based Methodology for fraud detection in social welfare programs: Bolsa Familia Analysis. Physica A: Statistical Mechanics and its Applications, [S. l.], v. 576, p. 125626, 2021. DOI 10.1016/j.physa.2020.125626. Disponível em: https://doi.org/10.1016/j.physa.2020.125626 Acesso em: 9 abr. 2026.

CAIZA, G. Navigating Governmental Choices: A Comprehensive Review of Artificial Intelligence’s Impact on Decision-Making. Informatics, [s. l.], v. 11, n. 64, ed. 3, 2024. DOI 10.3390/informatics11030064. Disponível em: https://doi.org/10.3390/informatics11030064 Acesso em: 11 abr. 2026.

CHAWLA, N. V.; BOWYER, K. W.; HALL, L. O.; KEGELMEYER, W. P. SMOTE: Synthetic Minority Over-sampling Technique. J. Artif. Intell. Res, [s. l.], v. 16, 2002. DOI 10.1613/jair.953. Disponível em: https://doi.org/10.1613/jair.953 Acesso em: 11 abr. 2026.

CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. Proc. 22nd ACM SIGKDD Int. Conf. Knowl. Discov. Data Min, [s. l.], p. 785-794, 2016. DOI 10.1145/2939672.2939785. Disponível em: https://doi.org/10.1145/2939672.2939785 Acesso em: 16 abr. 2026.

DESORDI, Danubia; BONA, Carla Della. A inteligência artificial e a eficiência na administração pública. Revista de Direito, [S. l.], v. 12, n. 02, p. 01–22, 2020. Disponível em: https://periodicos.ufv.br/revistadir/article/view/9112 Acesso em: 9 abr. 2026 DOI: https://doi.org/10.32361/202012029112

FACELI, Katti; LORENA, Ana C.; GAMA, João; ALMEIDA, Tiago Agostinho De; CARVA, André C. P. L. F De. Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 3. ed. Rio de Janeiro: LTC, 2025. E-book. p.iii. ISBN 9788521639213. Disponível em: https://app.minhabiblioteca.com.br/reader/books/9788521639213/ Acesso em: 12 abr. 2026.

GÉRON, Aurélien. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras & TensorFlow. 2. ed. Rio de Janeiro: Alta Books, 2021. 640 p. ISBN 8550815489.

KOUTNÍK, J.; GREFF, K.; GOMEZ, F.; SCHMIDHUBER, J. A Clockwork RNN. Proc. 31st Int. Conf. Mach. Learn. (ICML), Beijing, v. 32, 2014. DOI 10.48550/arXiv.1402.3511. Disponível em: https://doi.org/10.48550/arXiv.1402.3511 Acesso em: 16 abr. 2026.

SUJON, K. M.; HASSAN, R.; CHOI, K.; SAMAD, M. A. Accuracy, precision, recall, f1-score, or MCC? empirical evidence from advanced statistics, ML, and XAI for evaluating business predictive models. Journal of Big Data, [s. l.], v. 12, n. 268, 2025. DOI 10.1186/s40537-025-01313-4. Disponível em: https://doi.org/10.1186/s40537-025-01313-4 Acesso em: 16 abr. 2026.

TAN, E. et al. Artificial intelligence and algorithmic decisions in fraud detection: An interpretive structural model. Data & Policy, Reino Unido, e25, ed. 5, p. 919–929, 2023. DOI 10.1017/dap.2023.22. Disponível em: https://doi.org/10.1017/dap.2023.22 Acesso em: 8 abr. 2026.

TISLENKO, M. D.; GAIDEL, A. V.; KUPRIYANOV, A. V. Comparison of feature selection algorithms for Data classification problems. 2022 VIII International Conference on Information Technology and Nan otechnology (ITNT), Samara, p. 1-5, 2022. DOI 10.1109/ITNT55410.2022.9848765. Disponível em: https://doi.org/10.1109/ITNT55410.2022.9848765 Acesso em: 16 abr. 2026.

ZENG, G. Invariance Properties and Evaluation Metrics Derived from the Confusion Matrix in Multiclass Classification. Mathematics, [s. l.], v. 13, ed. 16, p. 2609, 2025. DOI 10.3390/math13162609. Disponível em: https://doi.org/10.3390/math13162609 Acesso em: 16 abr. 2026.

Licencia

Derechos de autor 2026 RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.

Os direitos autorais dos artigos/resenhas/TCCs publicados pertecem à revista RECIMA21, e seguem o padrão Creative Commons (CC BY 4.0), permitindo a cópia ou reprodução, desde que cite a fonte e respeite os direitos dos autores e contenham menção aos mesmos nos créditos. Toda e qualquer obra publicada na revista, seu conteúdo é de responsabilidade dos autores, cabendo a RECIMA21 apenas ser o veículo de divulgação, seguindo os padrões nacionais e internacionais de publicação.

Cómo citar

Eduarda Bandeira Hora de Vasconcelos, M., Maria Lima Silva, V., & Martins Nascimento Gonçalves, S. (2026). APLICACIÓN DE MODELOS DE APRENDIZAJE MÁQUINA EN EL CONTEXTO DE BOLSA FAMÍLIA: UN ESTUDIO APLICADO EN RIO GRANDE DO NORTE Y PARAÍBA (L. Fernando da Cunha Silva, Trans.). RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218, 7(6), e768077. https://doi.org/10.47820/recima21.v7i6.8077

Descargar cita