Mejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datos

dc.contributor.advisorHerrera Cubides, Jhon Francined
dc.contributor.authorCotta García, Juan Guillermo
dc.contributor.authorHerrera Cubides, Jhon Francined
dc.contributor.authorGaona García, Paulo Alonso
dc.contributor.orcidHerrera Cubides Jhon Francined [0000-0003-1615-4656]
dc.date.accessioned2025-09-01T13:06:41Z
dc.date.available2025-09-01T13:06:41Z
dc.date.created2025-08-22
dc.descriptionSi bien los Recursos Educativos Abiertos (REA) son fundamentales para la enseñanza, el aprendizaje y la investigación gracias a las políticas de acceso abierto y las herramientas web, su potencial se ve frecuentemente limitado. A pesar de su crecimiento exponencial, muchos REA se publican con descripciones en los metadatos de baja calidad o incompletas, lo que dificulta su descubrimiento, recuperación y reutilización efectiva en repositorios digitales abiertos, generando problemas de ambigüedad e incoherencia. Para abordar esta problemática, se propone una estrategia basada en técnicas de machine learning (Modelos Extensos de Lenguaje LLM), técnicas de embeddings (representaciones vectoriales) para captura semántica con el fin de mejorar los elementos de metadata que describen los REA. Esta estrategia busca descubrir nuevos detalles que proporcionen una mejor descripción de un recurso, y así, maximizar el potencial de los REA en los diferentes repositorios digitales abiertos.
dc.description.abstractAlthough Open Educational Resources (OER) are fundamental for teaching, learning, and research thanks to open access policies and web tools their potential is often limited. Despite their exponential growth, many OERs are published with low-quality or incomplete metadata descriptions, which hinders their discovery, retrieval, and effective reuse in open digital repositories, leading to issues of ambiguity and inconsistency. To address this problem, a strategy is proposed based on machine learning techniques (Large Language Models - LLMs) and embedding techniques (vector representations) for semantic capture, aimed at improving the metadata elements that describe OERs. This strategy seeks to uncover new details that provide a better description of a resource, thereby maximizing the potential of OERs across various open digital repositories.
dc.format.mimetypepdf
dc.identifier.urihttp://hdl.handle.net/11349/98760
dc.language.isospa
dc.publisherUniversidad Distrital Francisco José de Caldas
dc.relation.referencesRaval, P., & Bhaidasna, H. (2024). A Review of Extracting Metadata from Scholarly Articles using Natural Language Processing (NLP). 2024 3rd International Conference on Automation, Computing and Renewable Systems (ICACRS), 1355-1359
dc.relation.referencesLudeña, X., Segarra-Faggioni, V., Romero-Pelaez, A., & Morocho-Yunga, J. (2024). Exploring Topics in Information Technology Open Educational Resources through the LDA Algorithm. Latin-American Journal of Computing (LAJC), IX(1). doi:10.5281/zenodo.10402399
dc.relation.referencesTavakoli, M., Mirette, E., Gábor, K., & Sören, A. (2021). Metadata Analysis of Open Educational Resources. In LAK21: 11th International Learning Analytics and Knowledge Conference (LAK21). Association for Computing Machinery, 1, 626–631. doi:https://doi.org/10.1145/3448139.3448208
dc.relation.referencesYu, D., & Xiang, B. (9 de 2023). Discovering topics and trends in the field of Artificial Intelligence: Using LDA topic modeling. Expert Systems with Applications, 225, 120114
dc.rights.accesoRestringido (Solo Referencia)
dc.rights.accessrightsRestrictedAccess
dc.subjectREA (Recurso Educativo Abierto)
dc.subjectMachine Learning
dc.subjectLLM (Modelos Extensos de Lenguaje)
dc.subjectRAG (Generación Aumentada por Recuperación)
dc.subjectSimilitud Semántica
dc.subject.keywordOER (Open Educational Resource)
dc.subject.keywordMachine Learning
dc.subject.keywordLLM (Large Language Model)
dc.subject.keywordRAG (Retrieval Augmented Generation)
dc.subject.keywordSemantic Similarity
dc.subject.lembMaestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas
dc.titleMejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datos
dc.title.titleenglishImprovement of the description of open educational resources, based on techniques using artificial intelligence, machine learning, and data mining
dc.typemasterThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.degreeInvestigación-Innovación
dc.type.driverinfo:eu-repo/semantics/bachelorThesis

Archivos

Bloque original

Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
CottaGarciaJuanGuillermo2025.pdf
Tamaño:
4.6 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
Licencia de uso y publicacion.pdf
Tamaño:
484.26 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: