Comparación de métricas de similitud en el método de imputación de datos k-vecinos más cercanos

Másmela Caita, Luis AlejandroNiño Traslaviña, Gisel Fernanda2025-05-052025-05-052024-12-12http://hdl.handle.net/11349/95228El tratamiento de datos faltantes es un problema común en el análisis de datos, y la imputación de datos es una técnica ampliamente utilizada para abordar este problema. Sin embargo, la elección del método de imputación adecuado puede influir significativamente en los resultados del análisis. Por lo tanto, es crucial investigar y comparar diferentes métodos de imputación para comprender su desempeño y efectividad en diversas situaciones. En este contexto, este proyecto se centra en la metodología de imputación de datos k-vecinos más cercanos. Se propone realizar una comparación de las variaciones de este método, utilizando diversas métricas de similitud como Chebyshov, Camberra, Manhattan, Euclidea y la medida de similaridad del coseno, para evaluar su desempeño en la estimación de medias a partir de conjuntos de datos incompletos.The treatment of missing data is a common problem in data analysis, and data imputation is a widely used technique to address this issue. However, the choice of the appropriate imputation method can significantly influence the analysis results. Therefore, it is crucial to investigate and compare different imputation methods to understand their performance and effectiveness in various situations. In this context, this project focuses on the k-nearest neighbors data imputation methodology. It proposes to compare variations of this method using different similarity metrics such as Chebyshev, Canberra, Manhattan, Euclidean, and cosine similarity to evaluate its performance in estimating means from incomplete datasets.pdfspaK-vecinos más cercanosMétricas de similitudImputación de datosAnálisis de datos faltantesComparación de métricas de similitud en el método de imputación de datos k-vecinos más cercanosbachelorThesisMatemáticas -- Tesis y disertaciones académicasRestrictedAccessComparison of similarity metrics in the k-nearest neighbors data imputation methodK-nearest neighborsSimilarity metricsData imputationMissing data analysisAbierto (Texto Completo)