ANÁLISE COMPARATIVA DE ALGORITMOS DE PREDIÇÃO EM DADOS TABULARES: REGRESSÃO LINEAR, RANDOM FOREST, GRADIENT BOOSTING E REDES NEURAIS MLP

Resumo

Este trabalho apresenta uma análise comparativa entre quatro algoritmos de aprendizado de máquina, aplicados a um problema de regressão supervisionada sobre dados tabulares reais: Regressão Linear, Random Forest, Gradient Boosting e Rede Neural Perceptron Multicamadas (MLP). O estudo adota um protocolo metodológico, contemplando pré-processamento com isolamento estrito das partições, validação cruzada K-Fold e escalonamento de atributos diferenciado por modelo. Os modelos são avaliados pelo coeficiente de determinação (R²) e pelo erro quadrático médio (MSE). Os resultados demonstram a superioridade dos métodos não lineares: Random Forest e MLP alcançaram R² ≈ 0,66, contra R² ≈ 0,18 da Regressão Linear. Os achados fornecem subsídios empíricos para a escolha algorítmica em tarefas de regressão e apontam perspectivas para trabalhos futuros com otimização de hiperparâmetros e extensão a múltiplos conjuntos de dados.

Referências

BREIMAN, Leo. Random forests. Machine Learning, New York, v. 45, n. 1, p. 5-32, out. 2001 DOI: https://doi.org/10.1023/A:1010933404324

BREIMAN, Leo. Bagging predictors. Machine Learning, New York, v. 24, n. 2, p. 123-140, ago. 1996 DOI: https://doi.org/10.1007/BF00058655

FRIEDMAN, Jerome H. Greedy function approximation: a gradient boosting machine. The Annals of Statistics, Beachwood, v. 29, n. 5, p. 1189-1232, out. 2001 DOI: https://doi.org/10.1214/aos/1013203451

GÉRON, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 3. ed. Sebastopol: O'Reilly Media, 2025.

HASTIE, Trevor; TIBSHIRANI, Robert; FRIEDMAN, Jerome. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. New York: Springer, 2009.

KUHN, Max; JOHNSON, Kjell. Applied Predictive Modeling. New York: Springer, 2013.

RUMELHART, David E.; HINTON, Geoffrey E.; WILLIAMS, Ronald J. Learning representations by back-propagating errors. Nature, London, v. 323, n. 6088, p. 533-536, out. 1986 DOI: https://doi.org/10.1038/323533a0

WOLPERT, David H. The Lack of A Priori Distinctions Between Learning Algorithms. Neural Computation, Cambridge, v. 8, n. 7, p. 1341-1390, 1996.

Como Citar

Preuss, E. ., Argenta, I. P., Franciscatto, R., & Pertile, S. D. L. . (2026). ANÁLISE COMPARATIVA DE ALGORITMOS DE PREDIÇÃO EM DADOS TABULARES: REGRESSÃO LINEAR, RANDOM FOREST, GRADIENT BOOSTING E REDES NEURAIS MLP. RECIMA21 - Revista Científica Multidisciplinar - ISSN 2675-6218, 7(7), e778276. https://doi.org/10.47820/recima21.v7i7.8276