APPLICATION OF MACHINE LEARNING MODELS IN THE CONTEXT OF BOLSA FAMÍLIA: AN APPLIED STUDY IN RIO GRANDE DO NORTE AND PARAÍBA

Luiz Fernando da Cunha Silva; Maria Eduarda Bandeira Hora de Vasconcelos; Verônica Maria Lima Silva; Samara Martins Nascimento Gonçalves

doi:10.47820/recima21.v7i6.8077

APLICAÇÃO DE MODELOS DE APRENDIZAGEM DE MÁQUINA NO CONTEXTO DO BOLSA FAMÍLIA: UM ESTUDO APLICADO NO RIO GRANDE DO NORTE E PARAÍBA

Autores

Luiz Fernando da Cunha Silva Universidade Federal Rural do Semi-Árido (UFERSA)

https://orcid.org/0009-0007-7953-3561

Maria Eduarda Bandeira Hora de Vasconcelos Universidade Federal da Paraíba (UFPB)

https://orcid.org/0009-0008-9644-3071

Verônica Maria Lima Silva Universidade Federal da Paraíba (UFPB)

https://orcid.org/0000-0002-8980-6910

Samara Martins Nascimento Gonçalves Universidade Federal Rural do Semi-Árido (UFERSA)

DOI

https://doi.org/10.47820/recima21.v7i6.8077

Palavras-chave

Machine Learning. Public Administration. Bolsa Família.

Publicado 27/05/2026 na edição v. 7 n. 6 (2026) Seção ARTIGOS

Downloads

PDF (Inglês)

Estatísticas de download

Estatísticas indisponíveis.

Resumo

Este estudo investiga a aplicação de técnicas de Aprendizado de Máquina para apoiar a tomada de decisões na administração pública, com foco na predição da elegibilidade de famílias para o Programa Bolsa Família nos estados brasileiros do Rio Grande do Norte e da Paraíba. Microdados anonimizados do Cadastro Único (2016–2018) foram utilizados para treinar e avaliar modelos preditivos. Após o pré-processamento dos dados, balanceamento de classes com a Técnica de Sobreamostragem Sintética da Minoria (SMOT) e redução de dimensionalidade utilizando o SelectKBest, cinco modelos de Aprendizado de Máquina foram implementados: K-Nearest Neighbors (KNN), Support Vector Machine (SVM), Random Forest (Floresta Aleatória), XGBoost e uma Rede Neural Recorrente (RN). Os resultados mostram que os modelos baseados em árvores, redes neurais e SVM apresentam desempenho robusto em ambos os estados, com acurácia de até 90%. Random Forest, XGBoost e RN mostraram-se mais estáveis na Floresta Aleatória, enquanto SVM obteve o melhor desempenho na Paraíba, indicando diferenças regionais na separabilidade dos dados. A seleção de características reduziu efetivamente a complexidade do modelo sem perda de precisão, destacando a renda, a estrutura familiar, o acesso a serviços básicos e o tamanho da família como determinantes-chave da elegibilidade.

Biografia do Autor

Luiz Fernando da Cunha Silva, Universidade Federal Rural do Semi-Árido (UFERSA)

Graduado em Sistemas de Informação pela Universidade Federal Rural do Semi-Árido (UFERSA). Atua como pesquisador colaborador no Instituto Tecnológico de Aeronáutica (ITA) na área de pesquisa espacial e participa de projetos de pesquisa na Universidade Federal Rural do Semi-Árido (UFERSA) e na Universidade Federal da Paraíba (UFPB), incluindo Women in STEM e DATALAB. Suas principais áreas de interesse incluem Ciência de Dados, Inteligência Artificial, Aprendizado de Máquina, Sistemas Inteligentes e Desenvolvimento de Sistemas.

Maria Eduarda Bandeira Hora de Vasconcelos, Universidade Federal da Paraíba (UFPB)

Graduanda em Ciência de Dados e Inteligência Artificial pela Universidade Federal da Paraíba (UFPB). Possui conhecimentos em programação com Python, JavaScript e C/C++. Desenvolve projetos que entregam soluções relevantes por meio da análise de dados reais e da aplicação de modelos de aprendizado de máquina. Tem interesse nas áreas de inteligência artificial, bancos de dados e testes de software.

Verônica Maria Lima Silva, Universidade Federal da Paraíba (UFPB)

Possui graduação em Engenharia da Computação pela Universidade Federal do Ceará (2011). Desde 2015, atua como professora na Universidade Federal Rural do Semi-Árido (UFERSA) e obteve o título de Doutora em Engenharia Elétrica pela Universidade Federal de Campina Grande (UFCG) em 2019. Seus interesses de pesquisa incluem sistemas digitais, conversores analógico-digitais, conversores de informações analógicas, sistemas embarcados e inteligência artificial.

Samara Martins Nascimento Gonçalves, Universidade Federal Rural do Semi-Árido (UFERSA)

Doutora em Ciência da Computação pela Universidade Federal do Ceará. É Professora Associada da Universidade Federal Rural do Semi-Árido (UFERSA) e uma das líderes dos grupos de pesquisa do Laboratório de Inovações em Software (LIS). Seus principais interesses de pesquisa incluem Bancos de Dados, Big Data, Fluxos de Dados, Bancos de Dados NoSQL, Data Warehousing, Gerenciamento de Dados, Análise de Sistemas, Qualidade de Software e Métricas de Software.

Referências

ALSHEHHI, K.; CHEAITOU, A.; RASHID, H. Adoption Frameworks for Artificial Intelligence in the Public Sector: A Systematic Review of Literature. Proc. 3rd South Amer. Int. Ind. Eng. Oper. Manag. Conf, [s. l.], p. 919–929, 2022. DOI 10.46254/SA03.20220211. Disponível em: https://doi.org/10.46254/SA03.20220211 Acesso em: 8 abr. 2026.

AZEVEDO, C. S.; GONÇALVES, R. F.; GAVA, V. L.; SPINOLA, M. M. A Benford’s Law Based Methodology for fraud detection in social welfare programs: Bolsa Familia Analysis. Physica A: Statistical Mechanics and its Applications, [S. l.], v. 576, p. 125626, 2021. DOI 10.1016/j.physa.2020.125626. Disponível em: https://doi.org/10.1016/j.physa.2020.125626 Acesso em: 9 abr. 2026.

CAIZA, G. Navigating Governmental Choices: A Comprehensive Review of Artificial Intelligence’s Impact on Decision-Making. Informatics, [s. l.], v. 11, n. 64, ed. 3, 2024. DOI 10.3390/informatics11030064. Disponível em: https://doi.org/10.3390/informatics11030064 Acesso em: 11 abr. 2026.

CHAWLA, N. V.; BOWYER, K. W.; HALL, L. O.; KEGELMEYER, W. P. SMOTE: Synthetic Minority Over-sampling Technique. J. Artif. Intell. Res, [s. l.], v. 16, 2002. DOI 10.1613/jair.953. Disponível em: https://doi.org/10.1613/jair.953 Acesso em: 11 abr. 2026.

CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. Proc. 22nd ACM SIGKDD Int. Conf. Knowl. Discov. Data Min, [s. l.], p. 785-794, 2016. DOI 10.1145/2939672.2939785. Disponível em: https://doi.org/10.1145/2939672.2939785 Acesso em: 16 abr. 2026.

DESORDI, Danubia; BONA, Carla Della. A inteligência artificial e a eficiência na administração pública. Revista de Direito, [S. l.], v. 12, n. 02, p. 01–22, 2020. Disponível em: https://periodicos.ufv.br/revistadir/article/view/9112 Acesso em: 9 abr. 2026 DOI: https://doi.org/10.32361/202012029112

FACELI, Katti; LORENA, Ana C.; GAMA, João; ALMEIDA, Tiago Agostinho De; CARVA, André C. P. L. F De. Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 3. ed. Rio de Janeiro: LTC, 2025. E-book. p.iii. ISBN 9788521639213. Disponível em: https://app.minhabiblioteca.com.br/reader/books/9788521639213/ Acesso em: 12 abr. 2026.

GÉRON, Aurélien. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras & TensorFlow. 2. ed. Rio de Janeiro: Alta Books, 2021. 640 p. ISBN 8550815489.

KOUTNÍK, J.; GREFF, K.; GOMEZ, F.; SCHMIDHUBER, J. A Clockwork RNN. Proc. 31st Int. Conf. Mach. Learn. (ICML), Beijing, v. 32, 2014. DOI 10.48550/arXiv.1402.3511. Disponível em: https://doi.org/10.48550/arXiv.1402.3511 Acesso em: 16 abr. 2026.

SUJON, K. M.; HASSAN, R.; CHOI, K.; SAMAD, M. A. Accuracy, precision, recall, f1-score, or MCC? empirical evidence from advanced statistics, ML, and XAI for evaluating business predictive models. Journal of Big Data, [s. l.], v. 12, n. 268, 2025. DOI 10.1186/s40537-025-01313-4. Disponível em: https://doi.org/10.1186/s40537-025-01313-4 Acesso em: 16 abr. 2026.

TAN, E. et al. Artificial intelligence and algorithmic decisions in fraud detection: An interpretive structural model. Data & Policy, Reino Unido, e25, ed. 5, p. 919–929, 2023. DOI 10.1017/dap.2023.22. Disponível em: https://doi.org/10.1017/dap.2023.22 Acesso em: 8 abr. 2026.

TISLENKO, M. D.; GAIDEL, A. V.; KUPRIYANOV, A. V. Comparison of feature selection algorithms for Data classification problems. 2022 VIII International Conference on Information Technology and Nan otechnology (ITNT), Samara, p. 1-5, 2022. DOI 10.1109/ITNT55410.2022.9848765. Disponível em: https://doi.org/10.1109/ITNT55410.2022.9848765 Acesso em: 16 abr. 2026.

ZENG, G. Invariance Properties and Evaluation Metrics Derived from the Confusion Matrix in Multiclass Classification. Mathematics, [s. l.], v. 13, ed. 16, p. 2609, 2025. DOI 10.3390/math13162609. Disponível em: https://doi.org/10.3390/math13162609 Acesso em: 16 abr. 2026.

Licença

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.

Os direitos autorais dos artigos/resenhas/TCCs publicados pertecem à revista RECIMA21, e seguem o padrão Creative Commons (CC BY 4.0), permitindo a cópia ou reprodução, desde que cite a fonte e respeite os direitos dos autores e contenham menção aos mesmos nos créditos. Toda e qualquer obra publicada na revista, seu conteúdo é de responsabilidade dos autores, cabendo a RECIMA21 apenas ser o veículo de divulgação, seguindo os padrões nacionais e internacionais de publicação.

Como Citar

Eduarda Bandeira Hora de Vasconcelos, M., Maria Lima Silva, V., & Martins Nascimento Gonçalves, S. (2026). APLICAÇÃO DE MODELOS DE APRENDIZAGEM DE MÁQUINA NO CONTEXTO DO BOLSA FAMÍLIA: UM ESTUDO APLICADO NO RIO GRANDE DO NORTE E PARAÍBA (L. F. da Cunha Silva, Trad.). RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218, 7(6), e768077. https://doi.org/10.47820/recima21.v7i6.8077

Baixar Citação