Identificación de patrones de deserción y riesgo académico en carreras de la Facultad de Ingeniería de la Universidad Distrital a través de técnicas Machine Learning

dc.contributor.advisorContreras Bravo, Leonardo Emiro
dc.contributor.authorSalamanca Vásquez, Esteban
dc.contributor.orcidContreras Bravo, Leonardo Emiro [0000-0003-4625-8835]
dc.date.accessioned2025-03-21T19:03:43Z
dc.date.available2025-03-21T19:03:43Z
dc.date.created2024-12-09
dc.descriptionEl presente trabajo se enfoca en el desarrollo de un modelo predictivo para identificar el riesgo de los estudiantes de la Universidad Distrital de quedar en prueba académica o de abandonar sus estudios. La deserción y el riesgo académico representan problemas cruciales para la institución, afectando tanto la trayectoria académica de los estudiantes como la capacidad de la universidad para cumplir su misión educativa. La deserción se refiere a cuando un estudiante abandona sus estudios antes de culminarlos, mientras que la prueba académica se asigna a estudiantes con un desempeño deficiente, como la pérdida de múltiples materias o la repetición de un curso por tercera vez. Este trabajo tiene como objetivo principal identificar patrones y factores asociados con la deserción y el riesgo académico a través de un análisis exploratorio de datos, basado en variables significativas extraídas de la literatura. Entre estas se encuentran el nivel socioeconómico, el rendimiento académico, la distancia de residencia a la universidad, resultados en el examen ICFES, tipo de colegio y el historial de notas de cada estudiante. La investigación emplea técnicas de análisis exploratorio de datos en combinación con métodos de aprendizaje automático, avanzando desde la preparación y selección de variables hasta la aplicación de transformaciones, con el fin de desarrollar un modelo de clasificación preciso para la predicción de deserción. A través de esta metodología, se espera identificar patrones y relaciones relevantes que reflejen el impacto de las variables seleccionadas sobre los resultados académicos. El modelo predictivo propuesto se enfoca en el uso de algoritmos de aprendizaje automático que permitan predecir el riesgo académico de cada estudiante de manera individual. Esto le brindará a la universidad una herramienta que posibilita la implementación de intervenciones y apoyos personalizados, con el objetivo de mejorar las tasas de retención y el éxito académico. En conclusión, este trabajo de grado representa un avance significativo hacia la creación de estrategias eficaces de retención estudiantil, con un enfoque basado en datos que permite comprender mejor los factores que inciden en la deserción y el riesgo académico, lo cual contribuye a la mejora del rendimiento académico en la Universidad Distrital.
dc.description.abstractThis paper focuses on the development of a predictive model to identify the risk of students at the Universidad Distrital of being placed on academic probation or dropping out of their studies. Dropout and academic risk represent crucial problems for the institution, affecting both the academic trajectory of students and the ability of the university to fulfill its educational mission. Dropout refers to when a student abandons his or her studies before completing them, while academic probation is assigned to students with poor performance, such as failing multiple subjects or repeating a course for the third time. This work's main objective is to identify patterns and factors associated with dropout and academic risk through an exploratory data analysis, based on significant variables extracted from the literature. These include socioeconomic level, academic performance, distance of residence to the university, ICFES exam results, type of school, and the grade history of each student. The research uses exploratory data analysis techniques in combination with machine learning methods, moving from the preparation and selection of variables to the application of transformations, in order to develop an accurate classification model for the prediction of dropouts. Through this methodology, it is expected to identify relevant patterns and relationships that reflect the impact of the selected variables on academic results. The proposed predictive model focuses on the use of machine learning algorithms that allow predicting the academic risk of each student individually. This will provide the university with a tool that enables the implementation of personalized interventions and supports, with the aim of improving retention rates and academic success. In conclusion, this degree work represents a significant advance towards the creation of effective student retention strategies, with a data-driven approach that allows a better understanding of the factors that affect dropout and academic risk, which contributes to the improvement of academic performance at the Universidad Distrital.
dc.format.mimetypepdf
dc.identifier.urihttp://hdl.handle.net/11349/94036
dc.language.isospa
dc.publisherUniversidad Distrital Francisco José de Caldas
dc.relation.referencesAggarwal, C. (2015). Data Mining: The Textbook. Springer International Publishing.
dc.relation.referencesAguilar Martínez, J. (2017). Análisis y clasificación con datos desequilibrados. Barcelona: Universitat rovira i virgili.
dc.relation.referencesAlpaydin, E. (2014). Introduction to Machine Learning. The MIT Press.
dc.relation.referencesBishop, C. M. (2006). Pattern recognition and machine learning. Springer.
dc.relation.referencesChen, T. &. (2016). XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794.
dc.relation.referencesDorogush, A. V. (2018). CatBoost: Gradient Boosting with Categorical Features Support. ArXiv preprint arXiv:1810.11363.
dc.relation.referencesGeurts, P. E. (2006). Extremely Randomized Trees. Machine Learning, 3-42.
dc.relation.referencesGodoy, F. (2021). Métodos clásicos de clasificación: comparación y aplicación. Bogota: Universidad Nacional de Córdoba.
dc.relation.referencesGoodfellow, I. B. (2016). Deep learning. MIT press.
dc.relation.referencesGutiérrez, A. C. (2019). Programa de intervención temprana en la prevención de la deserción estudiantil en educación superior. Revista Científica General José María Córdova, 127-143.
dc.relation.referencesGuyon, I., & Elisseeff, A. (2003). AnIntroduction to Variable and Feature Selection. Journal of Machine Learning Research 3, 1157-1182.
dc.relation.referencesGuzmán, C. (2009). Deserción estudiantil en la educación superior colombiana. Bogotá,Colombia: Ministerio de Educación Nacional.
dc.relation.referencesHastie, T. T. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
dc.relation.referencesJimenez, M. C. (2021). Abandono y permanencia en educación superior: Un análisis multinivel para Iberoamérica. Medellin: Universidad Nacional de Colombia.
dc.relation.referencesKe, G. M.-Y. (2017). LightGBM: A Highly Efficient Gradient Boosting Decision Tree. In Proceedings of the 31st Conference on Neural Information Processing Systems, 31149-3157.
dc.relation.referencesKohavi, R., & John, G. (1997). Wrappers for feature subset selection . Artificial Intelligence 97 , 273-324.
dc.relation.referencesKubat, M. (2017). An Introduction to Machine Learning. Springer.
dc.relation.referencesMEN, M. d. (2023, 08 07). SPADIES. Retrieved from https://www.mineducacion.gov.co/sistemasinfo/spadies/secciones/Estadisticas-de-desercion/
dc.relation.referencesMurphy, K. P. (2012). Machine learning: a probabilistic perspective. MIT press.
dc.relation.referencesPeña Sanchez de Rivera, D., & Peña Sanchez de Rivera , J. (1996). Un contraste de normalidad basado en la transformación Box-Cox. Estadistica Española, 33-46.
dc.relation.referencesRish, I. (2001). An empirical study of the naive Bayes classifier. Proceedings of IJCAI Workshop on Empirical Methods in AI, 41-46.
dc.relation.referencesSangüesa Sole, R. (n.d.). Preparacion de datos. universidad berta de cataunya.
dc.relation.referencesSpady, W. (1970). Dropouts from Higher Education: Toward an Empirical Model. Interchange.
dc.relation.referencesTinto, V. (1975). Dropout from Higher Education: A Theoretical Synthesis of Recent Research. Review of Educational Research.
dc.relation.referencesYeo, I., & Johnson, R. (2000). A new family of power transformations to improve normality or symmetry. Biometrika, 954-959.
dc.rights.accesoAbierto (Texto Completo)
dc.rights.accessrightsOpenAccess
dc.subjectMachine learning
dc.subjectAprendizaje supervisado
dc.subjectModelos de ensamble
dc.subjectCiencia de datos
dc.subjectDeserción universitaria
dc.subject.keywordMachine learning
dc.subject.keywordSupervised learning
dc.subject.keywordEnsemble models
dc.subject.keywordData science
dc.subject.keywordUniversity dropout
dc.subject.lembMaestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas
dc.subject.lembDeserción académica -- Bogotá (Colombia)spa
dc.subject.lembAprendizaje automático en educación -- Bogotá (Colombia)spa
dc.subject.lembMachine learning -- Bogotá (Colombia)spa
dc.subject.lembUniversidad Distrital Francisco José de Caldas (Bogotá)spa
dc.titleIdentificación de patrones de deserción y riesgo académico en carreras de la Facultad de Ingeniería de la Universidad Distrital a través de técnicas Machine Learning
dc.title.titleenglishIdentification of desertion patterns and academic risk in the Faculty of Engineering of the Universidad Distrital through Machine Learning techniques
dc.typemasterThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.degreeMonografía
dc.type.driverinfo:eu-repo/semantics/masterThesis

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
SalamancaVásquezEsteban2024.pdf
Tamaño:
1.88 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de Maestría
No hay miniatura disponible
Nombre:
Licencia de uso y publicación.pdf
Tamaño:
221.63 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: