Page 57 - 32FEGLININmar25
P. 57
© FEGLININ ISSN 2594-2298
| Año 8, No 32, enero - marzo 2025 |
Estos modelos se evaluaron mediante métricas como el coeficiente de determinación (R²), el error
absoluto medio (MAE) y el error cuadrático medio (MSE). Los datos fueron divididos en conjuntos
de entrenamiento (70%) y prueba (30%) para garantizar resultados consistentes y confiables.
Evaluaciones
El rendimiento de los modelos se evaluó utilizando el conjunto de prueba. Resultados destacados:
• Mejor modelo: Random Forest, con una precisión del 78.44% .
• Factores influyentes: Las variables Nivel de Estrés, Horas de Sueño y Participación en Clases
fueron las más relevantes en las predicciones.
• Errores comunes: Los modelos tendieron a subestimar el rendimiento de estudiantes con
niveles de estrés extremadamente altos.
RESULTADOS
En el análisis de los modelos de Machine Learning aplicados al rendimiento académico de los
estudiantes, se evaluaron diferentes algoritmos para identificar cuál ofrece la mejor capacidad
predictiva. Se probaron modelos como la Regresión Lineal, Árboles de Decisión, Bosques Aleatorios
y K-Vecinos Más Cercanos, cada uno con sus respectivas ventajas y limitaciones en función de la
naturaleza de los datos.
Los resultados obtenidos de los modelos de aprendizaje automático aplicados en este estudio son
consistentes con investigaciones previas que sugieren que los modelos de Bosques Aleatorios y
Árboles de Decisión son altamente efectivos en la predicción de resultados académicos (Sánchez et
al., 2019). Estos enfoques han mostrado su eficacia al manejar grandes volúmenes de datos y capturar
interacciones complejas (Martínez & López, 2020).
A continuación, se presentan los resultados obtenidos de cada modelo y su interpretación en el
contexto de la predicción del rendimiento académico
LinearRegression() :
Valor: Con un puntaje de 55.21, el desempeño del modelo de regresión lineal es moderado. Este valor
sugiere que, aunque el modelo ofrece un rendimiento aceptable, no está capturando completamente
las complejidades de las relaciones entre las variables. Esto puede deberse a que la regresión lineal
solo asume relaciones lineales, lo que limita su efectividad en problemas más complejos.
Uso: La regresión lineal es útil cuando se busca predecir una variable continúa basada en una relación
lineal con una o más variables independientes. Aunque su desempeño es adecuado cuando las
variables están correlacionadas linealmente, en casos con interacciones no lineales complejas, este
modelo muestra limitaciones, como se observa en el puntaje obtenido.
DecisionTreeRegressor() :
Valor: El modelo de árbol de decisión obtuvo un puntaje de 71.47, lo que indica un rendimiento
robusto y adecuado. Este valor sugiere que el árbol de decisión está capturando algunas relaciones no
lineales y puede manejar interacciones complejas entre las variables.
Uso: El árbol de decisión es ideal cuando los datos contienen relaciones no lineales, ya que segmenta
el conjunto de datos en grupos basados en características clave. El modelo muestra una mejora
significativa en comparación con la regresión lineal, lo que indica su capacidad para modelar
interacciones no lineales de manera eficiente.
RandomForestRegressor() :
Prefijo DOI: 10.70417
Pág. 57