Construcción de modelos de machine learning con aprendizaje supervisado para determinar la deserción académica en estudiantes universitarios

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

In this investigation, the objective has been set to make use of machine learning to generate predictions about the status of the student dropout, specifically for the Electrical Engineering and the Cadastral Engineering programs of the District University of Francisco José de Caldas. For the case of Electrical Engineering, data of 1834 students were used from semester 2009-1 to the semester 2018-3, while Cadastral Engineering, data of 2335 students were used from semester 2009-3 to the semester 2018-3. Features related to pre-university, socioeconomic, demographic, academic, and institutional factors are found in the databases. To make the predictions in the 10 semesters of duration of both programs, the following algorithms were used: decisión tree, logistic regression, KNN (K-nearest neighbor), SVM (Support Vector Machine) classifier and Naive Bayes. With the results obtained, it has been concluded that machine learning it’s a good option to predict the student dropout and that the information obtained by the predictions could be useful to help in the search of strategies that allow to reduce the universitary dropout.

Descripción

En esta investigación, se ha fijado como objetivo hacer uso del aprendizaje automático para generar predicciones sobre el estado de deserción estudiantil, específicamente para los programas de Ingeniería Eléctrica y de Ingeniería Catastral en la Universidad Distrital Francisco José de Caldas. Para el caso de Ingeniería Eléctrica, se han utilizado datos de 1834 estudiantes desde el semestre 2009-1 hasta el semestre 2018-3, mientras que para Ingeniería Catastral se utilizaron datos 2335 estudiantes desde el semestre 2009-3 hasta el semestre 2018-3. En las bases de datos se encuentran características relacionadas con factores pre-universitarios, socioeconómicos, demográficos, académicos e institucionales. Para realizar las predicciones en los 10 semestres que duran ambos planes de estudios, se utilizaron los siguientes algoritmos: árbol de decisión, regresión logística, KNN (K-vecinos más cercanos), SVM (máquinas de vectores de soporte) clasificador y Naive Bayes. Con los resultados obtenidos, se ha concluido que el aprendizaje automático es una buena opción para predecir la deserción de los estudiantes y que la información que se obtiene en las predicciones puede ayudar en la búsqueda de estrategias que permitan reducir la deserción universitaria.

Palabras clave

Deserción estudiantil, Aprendizaje automático, Árbol de decisión, Regresión logística, SVM, KNN

Materias

Ingeniería Industrial -- Tesis y disertaciones académicas , Deserción estudiantil , Aprendizaje automático , Ingeniería eléctrica , Ingeniería catastral

Citación