Mejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datos

Herrera Cubides, Jhon FrancinedCotta García, Juan GuillermoHerrera Cubides, Jhon FrancinedGaona García, Paulo Alonso2025-09-012025-09-012025-08-22http://hdl.handle.net/11349/98760Si bien los Recursos Educativos Abiertos (REA) son fundamentales para la enseñanza, el aprendizaje y la investigación gracias a las políticas de acceso abierto y las herramientas web, su potencial se ve frecuentemente limitado. A pesar de su crecimiento exponencial, muchos REA se publican con descripciones en los metadatos de baja calidad o incompletas, lo que dificulta su descubrimiento, recuperación y reutilización efectiva en repositorios digitales abiertos, generando problemas de ambigüedad e incoherencia. Para abordar esta problemática, se propone una estrategia basada en técnicas de machine learning (Modelos Extensos de Lenguaje LLM), técnicas de embeddings (representaciones vectoriales) para captura semántica con el fin de mejorar los elementos de metadata que describen los REA. Esta estrategia busca descubrir nuevos detalles que proporcionen una mejor descripción de un recurso, y así, maximizar el potencial de los REA en los diferentes repositorios digitales abiertos.Although Open Educational Resources (OER) are fundamental for teaching, learning, and research thanks to open access policies and web tools their potential is often limited. Despite their exponential growth, many OERs are published with low-quality or incomplete metadata descriptions, which hinders their discovery, retrieval, and effective reuse in open digital repositories, leading to issues of ambiguity and inconsistency. To address this problem, a strategy is proposed based on machine learning techniques (Large Language Models - LLMs) and embedding techniques (vector representations) for semantic capture, aimed at improving the metadata elements that describe OERs. This strategy seeks to uncover new details that provide a better description of a resource, thereby maximizing the potential of OERs across various open digital repositories.pdfspaREA (Recurso Educativo Abierto)Machine LearningLLM (Modelos Extensos de Lenguaje)RAG (Generación Aumentada por Recuperación)Similitud SemánticaMejoramiento de la descripción de recursos educativos abiertos, a partir de técnicas basadas en inteligencia artificial, machine learning y minería de datosmasterThesisMaestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicasRestrictedAccessImprovement of the description of open educational resources, based on techniques using artificial intelligence, machine learning, and data miningOER (Open Educational Resource)Machine LearningLLM (Large Language Model)RAG (Retrieval Augmented Generation)Semantic SimilarityRestringido (Solo Referencia)