Prototipo de análisis de información para el sistema de salud colombiano aplicado a la enfermedad renal crónica utilizando técnicas de aprendizaje computacional

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

This work deals with one of the problems presented by the health sector in Colombia, due to the increase in costs, related to the growing demand for services, mainly by patients with high-cost cataloged diseases, one of them being Chronic Kidney Disease (CKD), in addition to the scarce and deficient analysis of data that is applied in the country, where “Data Science” techniques and computational learning algorithms are little used. To improve the failures of the health system, first, a broad knowledge of the Colombian health insurance model was acquired. The data was obtained from an EPS and a statistical analysis was carried out using exploratory information methods, where in the data preparation phase, selection, cleaning and transformation processes were developed, which allowed obtaining quality data for mining and use of computational algorithms, and for this CRISP-DM was used, as a complete and detailed methodology of the mining process, in addition the main computer tool was the Anaconda Python distribution, which is widely used for Data Science and machine learning. The result was the obtaining of 2 statistical models to recommend for its application in relation to the cost of health services for people with CKD. Those models were the Ridge Regression model, in the first instance, and the Forest or Random Tree Regression model.

Descripción

Este trabajo trata una de las problemáticas que presenta el sector salud en Colombia, debido al aumento de los costos, relacionado a la creciente demanda de servicios, principalmente por parte de pacientes con enfermedades catalogadas de alto costo, siendo una de ellas, la Enfermedad Renal Crónica (ERC), además del escaso y deficiente análisis de datos que se aplica en el país, donde son poco usadas técnicas de “Data Science” y algoritmos de aprendizaje computacional. Para mejorar las fallas del sistema de salud, primero, se adquirió un conocimiento amplio del modelo de aseguramiento de salud colombiano. Los datos se obtuvieron de una EPS y se realizó un análisis estadístico utilizando métodos exploratorios de información, donde en la fase de preparación de los datos se desarrollaron procesos de selección, limpieza y transformaciones de los mismos, que permitieron obtener datos de calidad para la minería y uso de algoritmos computacionales, y para ello se utilizó CRISP-DM, como metodología completa y detallada del proceso de minería, además la herramienta informática principal fue la distribución Anaconda de Python, que es muy usada para Data Science y machine learning. El resultado fue la obtención de 2 modelos estadísticos a recomendar para su aplicación en lo referente al costo de servicios de salud por personas que padecen de ERC. Esos modelos fueron el de Regresión de Ridge, en primera instancia, y el de Regresión de Bosques o Árboles Aleatorios.

Palabras clave

Enfermedad Renal Crónica, Sistema de salud en Colombia, Minería de datos, Aprendizaje computacional, Ciencia de datos

Materias

Maestría en Ciencias de la Información y las Comunicaciones - Tesis y Disertaciones Académicas , Sistema Nacional de Salud - (Colombia) , Seguridad social- Aspectos económicos - Colombia , Minería de datos , Sistemas de almacenamiento y recuperación de información

Citación