APLICACIÓN DE MODELOS DE APRENDIZAJE MÁQUINA EN EL CONTEXTO DE BOLSA FAMÍLIA: UN ESTUDIO APLICADO EN RIO GRANDE DO NORTE Y PARAÍBA
Resumen
Este estudio investiga la aplicación de técnicas de aprendizaje automático para apoyar la toma de decisiones en la administración pública, centrándose en la predicción de la elegibilidad familiar para el Programa Bolsa Família en los estados brasileños de Rio Grande do Norte y Paraíba. Se utilizaron microdatos anonimizados de la base de datos Cadastro Único (2016–2018) para entrenar y evaluar modelos predictivos. Tras el preprocesamiento de datos, el balanceo de clases con la técnica Synthetic Minority Over-sampling Technique y la reducción de dimensionalidad mediante SelectKBest, se implementaron cinco modelos de aprendizaje automático: K-Nearest Neighbors, Support Vector Machine, Random Forest, XGBoost y una red neuronal recurrente. Los resultados muestran que los modelos basados en árboles, las redes neuronales y las máquinas de vectores de soporte logran un rendimiento robusto en ambos estados, con valores de precisión de hasta el 90 %. Random Forest, XGBoost y las redes neuronales recurrentes fueron más estables en RN, mientras que la máquina de vectores de soporte logró el mejor rendimiento en PB, lo que indica diferencias regionales en la separabilidad de los datos. La selección de características redujo eficazmente la complejidad del modelo sin pérdida de precisión, destacando los ingresos, la estructura familiar, el acceso a servicios básicos y el tamaño de la familia como determinantes clave de la elegibilidad.
Biografía del autor/a
Posee licenciatura en Sistemas de Información por la Universidade Federal Rural do Semi-Árido (UFERSA). Actúa como investigador colaborador en el Instituto Tecnológico de Aeronáutica (ITA) en el área de investigación espacial y participa en proyectos de investigación en la Universidade Federal Rural do Semi-Árido (UFERSA) y en la Universidade Federal da Paraíba (UFPB), incluidos Women in STEM y DATALAB. Sus principales áreas de interés incluyen Ciencia de Datos, Inteligencia Artificial, Aprendizaje Automático, Sistemas Inteligentes y Desarrollo de Sistemas.
Estudiante de pregrado en Ciencia de Datos e Inteligencia Artificial en la Universidade Federal da Paraíba (UFPB). Posee conocimientos en programación con Python, JavaScript y C/C++. Desarrolla proyectos que ofrecen soluciones relevantes mediante el análisis de datos reales y la aplicación de modelos de aprendizaje automático. Tiene interés en las áreas de inteligencia artificial, bases de datos y pruebas de software.
Posee licenciatura en Ingeniería de Computación por la Universidade Federal do Ceará (2011). Desde 2015, se desempeña como profesora en la Universidade Federal Rural do Semi-Árido (UFERSA) y obtuvo el título de Doctora en Ingeniería Eléctrica por la Universidade Federal de Campina Grande (UFCG) en 2019. Sus áreas de investigación incluyen sistemas digitales, convertidores analógico-digitales, convertidores de información analógica, sistemas embebidos e inteligencia artificial.
Posee doctorado en Ciencia de la Computación por la Universidade Federal do Ceará. Es Profesora Asociada de la Universidade Federal Rural do Semi-Árido (UFERSA) y una de las líderes de los grupos de investigación del Laboratorio de Innovaciones en Software (LIS). Sus principales áreas de investigación incluyen Bases de Datos, Big Data, Flujos de Datos, Bases de Datos NoSQL, Data Warehousing, Gestión de Datos, Análisis de Sistemas, Calidad de Software y Métricas de Software.
Referencias
ALSHEHHI, K.; CHEAITOU, A.; RASHID, H. Adoption Frameworks for Artificial Intelligence in the Public Sector: A Systematic Review of Literature. Proc. 3rd South Amer. Int. Ind. Eng. Oper. Manag. Conf, [s. l.], p. 919–929, 2022. DOI 10.46254/SA03.20220211. Disponível em: https://doi.org/10.46254/SA03.20220211 Acesso em: 8 abr. 2026.
AZEVEDO, C. S.; GONÇALVES, R. F.; GAVA, V. L.; SPINOLA, M. M. A Benford’s Law Based Methodology for fraud detection in social welfare programs: Bolsa Familia Analysis. Physica A: Statistical Mechanics and its Applications, [S. l.], v. 576, p. 125626, 2021. DOI 10.1016/j.physa.2020.125626. Disponível em: https://doi.org/10.1016/j.physa.2020.125626 Acesso em: 9 abr. 2026.
CAIZA, G. Navigating Governmental Choices: A Comprehensive Review of Artificial Intelligence’s Impact on Decision-Making. Informatics, [s. l.], v. 11, n. 64, ed. 3, 2024. DOI 10.3390/informatics11030064. Disponível em: https://doi.org/10.3390/informatics11030064 Acesso em: 11 abr. 2026.
CHAWLA, N. V.; BOWYER, K. W.; HALL, L. O.; KEGELMEYER, W. P. SMOTE: Synthetic Minority Over-sampling Technique. J. Artif. Intell. Res, [s. l.], v. 16, 2002. DOI 10.1613/jair.953. Disponível em: https://doi.org/10.1613/jair.953 Acesso em: 11 abr. 2026.
CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. Proc. 22nd ACM SIGKDD Int. Conf. Knowl. Discov. Data Min, [s. l.], p. 785-794, 2016. DOI 10.1145/2939672.2939785. Disponível em: https://doi.org/10.1145/2939672.2939785 Acesso em: 16 abr. 2026.
DESORDI, Danubia; BONA, Carla Della. A inteligência artificial e a eficiência na administração pública. Revista de Direito, [S. l.], v. 12, n. 02, p. 01–22, 2020. Disponível em: https://periodicos.ufv.br/revistadir/article/view/9112 Acesso em: 9 abr. 2026 DOI: https://doi.org/10.32361/202012029112
FACELI, Katti; LORENA, Ana C.; GAMA, João; ALMEIDA, Tiago Agostinho De; CARVA, André C. P. L. F De. Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 3. ed. Rio de Janeiro: LTC, 2025. E-book. p.iii. ISBN 9788521639213. Disponível em: https://app.minhabiblioteca.com.br/reader/books/9788521639213/ Acesso em: 12 abr. 2026.
GÉRON, Aurélien. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras & TensorFlow. 2. ed. Rio de Janeiro: Alta Books, 2021. 640 p. ISBN 8550815489.
KOUTNÍK, J.; GREFF, K.; GOMEZ, F.; SCHMIDHUBER, J. A Clockwork RNN. Proc. 31st Int. Conf. Mach. Learn. (ICML), Beijing, v. 32, 2014. DOI 10.48550/arXiv.1402.3511. Disponível em: https://doi.org/10.48550/arXiv.1402.3511 Acesso em: 16 abr. 2026.
SUJON, K. M.; HASSAN, R.; CHOI, K.; SAMAD, M. A. Accuracy, precision, recall, f1-score, or MCC? empirical evidence from advanced statistics, ML, and XAI for evaluating business predictive models. Journal of Big Data, [s. l.], v. 12, n. 268, 2025. DOI 10.1186/s40537-025-01313-4. Disponível em: https://doi.org/10.1186/s40537-025-01313-4 Acesso em: 16 abr. 2026.
TAN, E. et al. Artificial intelligence and algorithmic decisions in fraud detection: An interpretive structural model. Data & Policy, Reino Unido, e25, ed. 5, p. 919–929, 2023. DOI 10.1017/dap.2023.22. Disponível em: https://doi.org/10.1017/dap.2023.22 Acesso em: 8 abr. 2026.
TISLENKO, M. D.; GAIDEL, A. V.; KUPRIYANOV, A. V. Comparison of feature selection algorithms for Data classification problems. 2022 VIII International Conference on Information Technology and Nan otechnology (ITNT), Samara, p. 1-5, 2022. DOI 10.1109/ITNT55410.2022.9848765. Disponível em: https://doi.org/10.1109/ITNT55410.2022.9848765 Acesso em: 16 abr. 2026.
ZENG, G. Invariance Properties and Evaluation Metrics Derived from the Confusion Matrix in Multiclass Classification. Mathematics, [s. l.], v. 13, ed. 16, p. 2609, 2025. DOI 10.3390/math13162609. Disponível em: https://doi.org/10.3390/math13162609 Acesso em: 16 abr. 2026.
