Propuesta de técnica(s) híbrida(s) basada(s) en la comparación de técnicas de aprendizaje computacional para el manejo de datos faltantes en aplicaciones OLAP

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

La calidad de los datos es un aspecto que se debe considerar en cualquier análisis de datos ya que las inconsistencias que pudieran presentarse generarían imprecisiones para la toma de decisiones. De ahí que, para llevar a cabo cualquier proceso de exploración de datos, el preprocesamiento sea considerado una etapa importante compuesta por diversas tareas, dentro de las que se encuentra el relleno de valores faltantes, utilizadas para mejorar la calidad de los datos y la precisión y eficiencia de los posteriores procesos de los cuales es insumo. En este proyecto de investigación se realizó la revisión de algunas técnicas utilizadas directa o indirectamente en el relleno de valores faltantes. Con base en la verificación de las técnicas y los casos de estudio, se seleccionaron técnicas en el marco de los métodos basados en vecindad y redes neuronales, y se propuso una técnica híbrida (KMediasSom) que se aplicó a un conjunto de datos sintéticos y a un conjunto de datos reales provenientes de una aplicación OLAP (On-Line Analytical Processing), y se generaron resultados aceptables en ambos casos de acuerdo con los indicadores de evaluación obtenidos. Así mismo, con base en la complejidad computacional se concluyó que es viable su implementación.

Descripción

Palabras clave

Materias

Maestría en Ciencias de la Información y las Comunicaciones - Tesis y disertaciones académicas , Administración de bases de datos , Tecnología olap , Diseño de bases de datos

Citación