Mejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datos
| dc.contributor.advisor | Herrera Cubides, Jhon Francined | |
| dc.contributor.author | Cotta García, Juan Guillermo | |
| dc.contributor.author | Herrera Cubides, Jhon Francined | |
| dc.contributor.author | Gaona García, Paulo Alonso | |
| dc.contributor.orcid | Herrera Cubides Jhon Francined [0000-0003-1615-4656] | |
| dc.date.accessioned | 2025-09-01T13:06:41Z | |
| dc.date.available | 2025-09-01T13:06:41Z | |
| dc.date.created | 2025-08-22 | |
| dc.description | Si bien los Recursos Educativos Abiertos (REA) son fundamentales para la enseñanza, el aprendizaje y la investigación gracias a las políticas de acceso abierto y las herramientas web, su potencial se ve frecuentemente limitado. A pesar de su crecimiento exponencial, muchos REA se publican con descripciones en los metadatos de baja calidad o incompletas, lo que dificulta su descubrimiento, recuperación y reutilización efectiva en repositorios digitales abiertos, generando problemas de ambigüedad e incoherencia. Para abordar esta problemática, se propone una estrategia basada en técnicas de machine learning (Modelos Extensos de Lenguaje LLM), técnicas de embeddings (representaciones vectoriales) para captura semántica con el fin de mejorar los elementos de metadata que describen los REA. Esta estrategia busca descubrir nuevos detalles que proporcionen una mejor descripción de un recurso, y así, maximizar el potencial de los REA en los diferentes repositorios digitales abiertos. | |
| dc.description.abstract | Although Open Educational Resources (OER) are fundamental for teaching, learning, and research thanks to open access policies and web tools their potential is often limited. Despite their exponential growth, many OERs are published with low-quality or incomplete metadata descriptions, which hinders their discovery, retrieval, and effective reuse in open digital repositories, leading to issues of ambiguity and inconsistency. To address this problem, a strategy is proposed based on machine learning techniques (Large Language Models - LLMs) and embedding techniques (vector representations) for semantic capture, aimed at improving the metadata elements that describe OERs. This strategy seeks to uncover new details that provide a better description of a resource, thereby maximizing the potential of OERs across various open digital repositories. | |
| dc.format.mimetype | ||
| dc.identifier.uri | http://hdl.handle.net/11349/98760 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Distrital Francisco José de Caldas | |
| dc.relation.references | Raval, P., & Bhaidasna, H. (2024). A Review of Extracting Metadata from Scholarly Articles using Natural Language Processing (NLP). 2024 3rd International Conference on Automation, Computing and Renewable Systems (ICACRS), 1355-1359 | |
| dc.relation.references | Ludeña, X., Segarra-Faggioni, V., Romero-Pelaez, A., & Morocho-Yunga, J. (2024). Exploring Topics in Information Technology Open Educational Resources through the LDA Algorithm. Latin-American Journal of Computing (LAJC), IX(1). doi:10.5281/zenodo.10402399 | |
| dc.relation.references | Tavakoli, M., Mirette, E., Gábor, K., & Sören, A. (2021). Metadata Analysis of Open Educational Resources. In LAK21: 11th International Learning Analytics and Knowledge Conference (LAK21). Association for Computing Machinery, 1, 626–631. doi:https://doi.org/10.1145/3448139.3448208 | |
| dc.relation.references | Yu, D., & Xiang, B. (9 de 2023). Discovering topics and trends in the field of Artificial Intelligence: Using LDA topic modeling. Expert Systems with Applications, 225, 120114 | |
| dc.rights.acceso | Restringido (Solo Referencia) | |
| dc.rights.accessrights | RestrictedAccess | |
| dc.subject | REA (Recurso Educativo Abierto) | |
| dc.subject | Machine Learning | |
| dc.subject | LLM (Modelos Extensos de Lenguaje) | |
| dc.subject | RAG (Generación Aumentada por Recuperación) | |
| dc.subject | Similitud Semántica | |
| dc.subject.keyword | OER (Open Educational Resource) | |
| dc.subject.keyword | Machine Learning | |
| dc.subject.keyword | LLM (Large Language Model) | |
| dc.subject.keyword | RAG (Retrieval Augmented Generation) | |
| dc.subject.keyword | Semantic Similarity | |
| dc.subject.lemb | Maestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas | |
| dc.title | Mejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datos | |
| dc.title.titleenglish | Improvement of the description of open educational resources, based on techniques using artificial intelligence, machine learning, and data mining | |
| dc.type | masterThesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.degree | Investigación-Innovación | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis |
Archivos
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 7 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
