ANÁLISIS COMPARATIVO DE ALGORITMOS DE PREDICCIÓN EN DATOS TABULARES: REGRESIÓN LINEAL, BOSQUE ALEATORIO, POTENCIACIÓN DE GRADIENTE Y REDES NEURONALES MLP
Resumen
Este trabajo presenta un análisis comparativo de cuatro algoritmos de aprendizaje automático aplicados a un problema de regresión supervisada en datos tabulares reales: Regresión Lineal, Bosque Aleatorio, Gradient Boosting y Red Neuronal Perceptrón Multicapa (MLP). El estudio adopta un protocolo metodológico que incluye preprocesamiento con aislamiento estricto de particiones, validación cruzada K-Fold y escalado de características diferenciado por modelo. Los modelos se evalúan mediante el coeficiente de determinación (R²) y el error cuadrático medio (MSE). Los resultados demuestran la superioridad de los métodos no lineales: Bosque Aleatorio y MLP alcanzaron un R² ≈ 0,66, en comparación con un R² ≈ 0,18 para la Regresión Lineal. Los hallazgos proporcionan apoyo empírico para la selección de algoritmos en tareas de regresión y señalan perspectivas para trabajos futuros con optimización de hiperparámetros y extensión a múltiples conjuntos de datos.
Referencias
BREIMAN, Leo. Random forests. Machine Learning, New York, v. 45, n. 1, p. 5-32, out. 2001 DOI: https://doi.org/10.1023/A:1010933404324 DOI: https://doi.org/10.1023/A:1010933404324
BREIMAN, Leo. Bagging predictors. Machine Learning, New York, v. 24, n. 2, p. 123-140, ago. 1996 DOI: https://doi.org/10.1007/BF00058655 DOI: https://doi.org/10.1023/A:1018054314350
FRIEDMAN, Jerome H. Greedy function approximation: a gradient boosting machine. The Annals of Statistics, Beachwood, v. 29, n. 5, p. 1189-1232, out. 2001 DOI: https://doi.org/10.1214/aos/1013203451 DOI: https://doi.org/10.1214/aos/1013203451
GÉRON, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. 3. ed. Sebastopol: O'Reilly Media, 2025.
HASTIE, Trevor; TIBSHIRANI, Robert; FRIEDMAN, Jerome. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2. ed. New York: Springer, 2009. DOI: https://doi.org/10.1007/978-0-387-84858-7
KUHN, Max; JOHNSON, Kjell. Applied Predictive Modeling. New York: Springer, 2013. DOI: https://doi.org/10.1007/978-1-4614-6849-3
RUMELHART, David E.; HINTON, Geoffrey E.; WILLIAMS, Ronald J. Learning representations by back-propagating errors. Nature, London, v. 323, n. 6088, p. 533-536, out. 1986 DOI: https://doi.org/10.1038/323533a0 DOI: https://doi.org/10.1038/323533a0
WOLPERT, David H. The Lack of A Priori Distinctions Between Learning Algorithms. Neural Computation, Cambridge, v. 8, n. 7, p. 1341-1390, 1996. DOI: https://doi.org/10.1162/neco.1996.8.7.1341
