Comparación de modelos de NLP para la extracción de entidades nombradas en acciones de tutelas asociadas a temas de salud

dc.contributor.advisorMuñoz Quiñones, Gerardo Alcides
dc.contributor.authorArdila Montaño, Juan Esteban
dc.contributor.authorNiño Ladino, Julian Andrés
dc.date.accessioned2025-03-19T14:20:40Z
dc.date.available2025-03-19T14:20:40Z
dc.date.created2024-10-25
dc.descriptionEl sistema de salud de Colombia muchas veces se ve afectado por razones como la corrupción, la ineficiencia y la demora de trámites, lo que ocasiona constantemente quejas por parte de los usuarios. Muchas veces estas quejas afectan los derechos fundamentales de las personas, por lo que se pueden reclamar tales derechos por medio de las acciones de tutela. En el presente documento se propone extraer entidades relevantes para la clasificación y categorización de tutelas por medio de diferentes modelos de procesamiento de lenguaje natural. Se evaluará el desempeño de estos modelos utilizando métricas especializadas en la extracción de entidades nombradas, lo que permitirá comparar su rendimiento. Además, se realizarán ajustes en los hiperparámetros y métodos de entrenamiento para determinar el modelo más adecuado para esta tarea.
dc.description.abstractThe Colombian healthcare system is often affected by issues such as corruption, inefficiency, and delays in administrative processes, which frequently result in user complaints. These complaints often infringe on individuals' fundamental rights, leading to the filing of legal actions to claim such rights. This document proposes extracting relevant entities for the classification and categorization of legal actions using various natural language processing models. The performance of these models will be evaluated using specialized metrics for named entity extraction, allowing for a comparison of their effectiveness. Additionally, adjustments to hyperparameters and training methods will be made to determine the most suitable model for this task.
dc.format.mimetypepdf
dc.identifier.urihttp://hdl.handle.net/11349/93820
dc.language.isospa
dc.publisherUniversidad Distrital Francisco José de Caldas
dc.relation.referencesB. y Lozano. Laura, «Entre la burocracia y la negligencia: cuando hay fallas en la atención médica,» Pesquisa Javeriana, 2023.
dc.relation.references«Confianza y uso de la acción de tutela en Colombia,» Confianza y uso de la acción de tutela en Colombia, 2018. Dirección: https://cej.org.co/sala-de-prensa/justiciometro/confianza-y-uso-de-la-accion-de-tutela-en-colombia/.
dc.relation.referencesA. N. Constituyente, Constitución Política de Colombia. 1991, ISBN: 9789587973433. Dirección: https://pdba.georgetown.edu/Constitutions/Colombia/colombia91.pdf.
dc.relation.referencese. a. Ashish Vaswani Noam Shazeer, «Attention Is All You Need,» 2017. Dirección: https://arxiv.org/abs/1706.03762.
dc.relation.referencesM.-W. C. e. a. Jacob Devlin, «BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,» 2019. Dirección: https://arxiv.org/abs/1810.04805.
dc.relation.referencesC. Raffel, N. Shazeer, A. Roberts et al., «Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer,» 2020. Dirección: https://arxiv.org/abs/1910.10683.
dc.relation.referencesL. Palacios, «La Acción de tutela en salud: cuándo y cómo presentarla,» 2023. Dirección: https://consultorsalud.com/accion-de-tutela-salud-como-presentarla/#:~ =Estad%C3%ADsticas%20de%20tutelas%20de%20Salud%20en%20Colombia&text=Entre%20enero%20y%20septiembre%20de%2C%20tutelas%20promedio%20presentadas%20en%20202021..
dc.relation.referencesI. BBVA, «Machine learning: ¿qué es y cómo funciona?,» 2019. Dirección: https://www.bbva.com/es/innovacion/machine-learning-que-es-y-como-funciona/.
dc.relation.referencesSAP, «¿Qué es machine learning?,» Dirección: https://www.sap.com/latinamerica/products/artificial-intelligence/what-is-machine-learning.html.
dc.relation.referencesIBM, «¿Qué es machine learning?,» Dirección: https://www.ibm.com/es-es/topics/machine-learning.
dc.relation.referencesWikipedia, «Aprendizaje Automático,» Dirección: https://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico.
dc.relation.referencesWikipedia, «Regresión Lineal,» Dirección: https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal.
dc.relation.referencesIberdrola, «Beneficios del machine learning,» 2022. Dirección: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico.
dc.relation.referencesIBM, «¿Qué es Deep Learning?,» Dirección: https://www.ibm.com/es-es/topics/deep-learning.
dc.relation.referencesPureStorage, «¿Qué es un pipeline de datos?,» 2023. Dirección: https://www.purestorage.com/es/knowledge/what-is-a-data-pipeline.
dc.relation.referencesIBM, «¿Qué es una canalización de datos?,» Dirección: https://www.ibm.com/es-es/topics/data-pipeline.
dc.relation.referencesAmazon, «¿Qué es una canalización de datos?,» 2023. Dirección: https://aws.amazon.com/es/what-is/data-pipeline/.
dc.relation.referencesT. Naeem, «Arquitectura de canalización de datos: todo lo que necesita saber,» 2024. Dirección: https://www.astera.com/es/type/blog/data-pipeline-architecture/.
dc.relation.referencesIBM, «¿Qué son las bases de datos NoSQL?,» 2024. Dirección: https://www.ibm.com/es-es/topics/nosql-databases.
dc.relation.referencesOracle, «¿Qué es NoSQL?,» 2024. Dirección: https://www.oracle.com/co/database/nosql/what-is-nosql/.
dc.relation.referencesMicrosoft, «Base de datos NoSQL: ¿qué es NoSQL?,» 2024. Dirección: https://azure.microsoft.com/es-mx/resources/cloud-computing-dictionary/what-is-nosql-database.
dc.relation.referencesMicrosoft, «Datos no relacionales y NoSQL,» 2024. Dirección: https://learn.microsoft.com/es-mx/azure/architecture/data-guide/big-data/non-relational-data.
dc.relation.referencesAmazon, «¿Qué es NoSQL?,» 2024. dirección: https://aws.amazon.com/es/nosql/.
dc.relation.referencesSNGULAR, «Base de datos orientada a Grafos. ¿Qué son y para qué se usan?,» 2019. dirección: https://www.sngular.com/es/insights/227/que-son-bases-datos-a-grafos.
dc.relation.referencesOracle, «Definición de base de datos orientada a grafos,» 2024. dirección: https://www.oracle.com/co/autonomous-database/what-is-graph-database/.
dc.relation.referencesWikipedia, «Base de datos orientada a grafos,» dirección: https://es.wikipedia.org/wiki/Base_de_datos_orientada_a_grafos.
dc.relation.referencesAmazon, «¿Qué es el Procesamiento de lenguaje natural (NLP)?,» 2023. dirección: https://aws.amazon.com/es/what-is/nlp/.
dc.relation.referencesIBM, «What is natural language processing (NLP)?,» 2024. dirección: https://www.ibm.com/topics/natural-language-processing.
dc.relation.referencesM. Battocchia, «Preprocesamiento de texto para NLP,» 2020. dirección: https://matiasbattocchia.github.io/datitos/Preprocesamiento-de-texto-para-NLP-parte-1.html.
dc.relation.referencesH. Face, The Hugging Face Course, 2022, https://huggingface.co/course, [Chapter 2, Tokenizers], 2022.
dc.relation.referencesgeeksforgeeks, «Word Embeddings in NLP,» 2024. dirección: https://www.geeksforgeeks.org/word-embeddings-in-nlp/.
dc.relation.referencesWikipedia, «Persistent data structure,» 2024. dirección: https://en.wikipedia.org/wiki/Persistent_data_structure.
dc.relation.referencesKlippa, «¿Qué es el Reconocimiento de Entidades Nombradas y Cómo Funciona?,» 2023. dirección: https://www.klippa.com/es/blog/informativo/reconocimiento-entidades-nombradas/.
dc.relation.referencesWikipedia, «Reconocimiento de entidades nombradas,» dirección: https://es.wikipedia.org/wiki/Reconocimiento_de_entidades_nombradas.
dc.relation.referencesA. Roberts y C. Raffel, «Exploring Transfer Learning with T5: the Text-To-Text Transfer Transformer,» 2020. dirección: https://research.google/blog/exploring-transfer-learning-with-t5-the-text-to-text-transfer-transformer/.
dc.relation.referencesA. Ibarra, «ACCIÓN DE TUTELA Guía y Modelo Rama Judicial,» Consejo Superior de la Judicatura, 2013, Accedido: Sep. 2024.
dc.relation.referencesP. S. Foundation, Python 3.12.7 documentation, https://docs.python.org/3/, 2024.
dc.relation.referencesGoogle, Colaboratory, Preguntas Frecuentes, https://research.google.com/colaboratory/faq.html, 2024.
dc.relation.referencesJ. S. L. Inc., Spark NLP Docs, https://sparknlp.org/docs/en/quickstart, 2024.
dc.relation.referencesT. R. Team, Ray Docs, https://docs.ray.io/en/latest/cluster/getting-started.html, 2024.
dc.relation.referencesN. Autor, Dockerfile para Jupyter Notebook, Accedido el 26 de agosto, 2024. dirección: https://ejemplo.com/dockerfile.
dc.relation.referencesI. HumanSignal, Label Studio Docs, https://labelstud.io/guide/, 2024.
dc.relation.referencesM. Romero, mrm8488/bert-spanish-cased-finetuned-ner, https://huggingface.co/mrm8488/bert-spanish-cased-finetuned-ner.
dc.relation.referencesZ. Pan, Q. Wu, H. Jiang et al., «LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt Compression,» ArXiv preprint, vol. abs/2403.12968, 2024. dirección: https://arxiv.org/abs/2403.12968.
dc.relation.referencesP. He, J. Gao y W. Chen, DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-Disentangled Embedding Sharing, 2021. arXiv:2111.09543 [cs.CL].
dc.relation.referencesM. Sotaquira, Redes Transformers (... o el fin de las Redes Recurrentes), 2020. dirección: https://www.youtube.com/watch?v=Wp8N0cXW_C4&t=0s.
dc.relation.referencesI. Montani, NLP avanzado con spaCy, https://course.spacy.io/es/, Accedido: Sep. 2024, 2020.
dc.relation.referencesP. de la república de Colombia, «Por el cual se reglamenta la acción de tutela consagrada en el artículo 86 de la Constitución Política de Colombia, Art. 37, nov. 19, 1991.,» Decreto 2591 de 1991, 1991.
dc.relation.referencesC. P. de Colombia, Artículos 11-41, julio de 1991.
dc.relation.referencesE. Ramírez, Alcances del derecho a la salud en Colombia: una revisión constitucional, legal y jurisprudencial, Universidad del Norte, Accedido: Sep. 2024, 28 de nov., 2012.
dc.relation.referencesJ. D. la Rosa y Eduardo G. Ponferrada y Manu Romero y Paulo Villegas y Pablo González de Prado Salas y María Grandury, «BERTIN: Efficient Pre-Training of a Spanish Language Model using Perplexity Sampling,» Procesamiento del Lenguaje Natural, vol. 68, n.º 0, págs. 13-23, 2022, ISSN: 1989-7553. dirección: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6403.
dc.relation.referencesA. G. Fandiño, J. A. Estapé, M. Pàmies et al., «MarIA: Spanish Language Models,» Procesamiento del Lenguaje Natural, vol. 68, 2022, ISSN: 1135-5948. DOI: 10.26342/2022-68-3. dirección: https://upcommons.upc.edu/handle/2117/367156#.YyMTB4X9A-0.mendeley.
dc.relation.referencesA. Conneau, K. Khandelwal, N. Goyal et al., «Unsupervised Cross-lingual Representation Learning at Scale,» CoRR, vol. abs/1911.02116, 2019. arXiv: 1911.02116. dirección: http://arxiv.org/abs/1911.02116.
dc.relation.referencesG. de España, «¿Qué es la Inteligencia Artificial,» Plan de Recuperación, Transformación y Resiliencia, 2023.
dc.relation.referencesT. y Meulder.F.D, «Introduction to the CoNLL-2003 Shared Task: Language-Independent Named Entity Recognition,» CNTS-Language Technology Group, 2003. dirección: https://arxiv.org/abs/cs/0306050.
dc.relation.referencesJ. e. a. Li.Xiaoya, «A Unified MRC Framework for Named Entity Recognition,» Department of Computer Science and Technology, Zhejiang University, 2022. dirección: https://paperswithcode.com/paper/a-unified-mrc-framework-for-named-entity.
dc.relation.referencesWikipedia, «Inteligencia artificial,» 2020. dirección: https://es.wikipedia.org/wiki/Inteligencia_artificial.
dc.relation.referencesIberdrola, «¿Qué es la Inteligencia Artificial?,» 2022. dirección: https://www.iberdrola.com/innovacion/que-es-inteligencia-artificial.
dc.relation.referencesAmazon, «¿Qué es la Inteligencia Artificial?,» 2021. dirección: https://aws.amazon.com/es/what-is/artificial-intelligence/.
dc.relation.referencesC. Infante, Guía para la presentación de proyectos de investigación, Universidad Nacional de Colombia, 2015, ISBN: 9789587194609. dirección: https://books.google.com.co/books?id=QJTGDwAAQBAJ.
dc.relation.referencesA. C. R. Cañari, Conceptos, algoritmo y aplicación al problema de las N – reinas, 2005, cap. Capítulo 2. Heurística y metaheurística.
dc.relation.referencesG. Burgos, «En Colombia se rompió un nuevo récord, pero de tutelas: este es el derecho que más se reclama,» 2024. dirección: https://www.infobae.com/colombia/2023/12/22/en-colombia-se-rompio-un-nuevo-record-pero-de-tutelas-este-es-el-derecho-que-mas-se-reclama/.
dc.rights.accesoRestringido (Solo Referencia)
dc.rights.accessrightsRestrictedAccess
dc.subjectTransformadores
dc.subjectProcesamiento de lenguaje natural
dc.subjectExtraccion de entidades nombradas
dc.subjectBERT
dc.subjectT5
dc.subject.keywordTransformer
dc.subject.keywordNatural Language Processing
dc.subject.keywordNamed Entity Recognition
dc.subject.keywordBERT
dc.subject.keywordT5
dc.subject.lembIngeniería Electrónica -- Tesis y Disertaciones Académicas
dc.subject.lembTransformadores eléctricos
dc.subject.lembDerecho a la salud -- Legislación -- Colombia
dc.subject.lembProcesamiento electrónico de datos -- Salud -- Colombia
dc.titleComparación de modelos de NLP para la extracción de entidades nombradas en acciones de tutelas asociadas a temas de salud
dc.title.titleenglishComparison of NLP models for named entity extraction in legal actions related to health issues
dc.typebachelorThesis
dc.type.degreePasantía
dc.type.driverinfo:eu-repo/semantics/bachelorThesis

Archivos

Bloque original

Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
NiñoLadinoJulianAndres2024.pdf
Tamaño:
12.16 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
No hay miniatura disponible
Nombre:
Licencia de uso y publicacion.pdf
Tamaño:
233.09 KB
Formato:
Adobe Portable Document Format
Descripción:
Licencia de uso y publicación

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: