Propuesta de técnica(s) híbrida(s) basada(s) en la comparación de técnicas de aprendizaje computacional para el manejo de datos faltantes en aplicaciones OLAP
Fecha
Autor corporativo
Título de la revista
ISSN de la revista
Título del volumen
Editor
Compartir
Altmetric
Resumen
La calidad de los datos es un aspecto que se debe considerar en cualquier análisis de datos ya que las inconsistencias que pudieran presentarse generarían imprecisiones para la toma de decisiones. De ahí que, para llevar a cabo cualquier proceso de exploración de datos, el preprocesamiento sea considerado una etapa importante compuesta por diversas tareas, dentro de las que se encuentra el relleno de valores faltantes, utilizadas para mejorar la calidad de los datos y la precisión y eficiencia de los posteriores procesos de los cuales es insumo. En este proyecto de investigación se realizó la revisión de algunas técnicas utilizadas directa o indirectamente en el relleno de valores faltantes. Con base en la verificación de las técnicas y los casos de estudio, se seleccionaron técnicas en el marco de los métodos basados en vecindad y redes neuronales, y se propuso una técnica híbrida (KMediasSom) que se aplicó a un conjunto de datos sintéticos y a un conjunto de datos reales provenientes de una aplicación OLAP (On-Line Analytical Processing), y se generaron resultados aceptables en ambos casos de acuerdo con los indicadores de evaluación obtenidos. Así mismo, con base en la complejidad computacional se concluyó que es viable su implementación.
