Latin-American Journal of Computing (Jul 2021)
Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado
Abstract
En el presente artículo se aplica un modelo de aprendizaje automático supervisado que predice la probabilidad de que un estudiante de la Escuela Politécnica Nacional apruebe el curso de nivelación. Para llevar a cabo esta tarea se describe una metodología estadística basada en gradient boosting y regresión logística donde el problema de aprendizaje se formula en términos de la minimización de la función de error mediante el método del descenso del gradiente. Para explicar la probabilidad de aprobación se toman en consideración dimensiones sugeridas por la literatura relacionadas a variables socioeconómicas, demográficas, familiares, institucionales y de desempeño académico en la postulación y en el curso de nivelación que tiene el estudiante. Los resultados del modelo de árbol de decisión muestran un nivel de precisión del 96% en el conjunto de datos de prueba, con un área bajo la curva ROC de 89.1, siendo estos niveles generalmente aceptados. Por otro lado, los resultados de la regresión logística sugieren que factores como la calificación ponderada del primer bimestre, la calificación con la que postuló, su jornada de estudios, su ubicación geográfica de origen, entre otras, afectan de una u otra manera a la probabilidad del estudiante, de aprobar el curso de nivelación.