Coronado Sanchéz, Paulo CesarBenavides Tocarruncho, NataliaEscobar Calderón, Santiago2024-10-312024-10-312024-08-22http://hdl.handle.net/11349/52702En el contexto de la actualización catastral en Colombia y su importancia para la toma de decisiones gubernamentales, la calidad de los datos desempeña un papel crucial en el desarrollo adecuado de los procesos catastrales. Es necesario agilizar estos procesos, hacerlos más eficientes y evitar las inconsistencias establecidas en los modelos de calidad definidos por el Instituto Geográfico Agustín Codazzi (IGAC) para avanzar en dichos procesos. La aplicación de tecnologías como el aprendizaje maquina contribuye a aumentar la eficiencia en estos procedimientos. Como solución, se propuso un modelo de aprendizaje de maquina para verificar la calidad de los datos catastrales de municipios del departamento de Casanare mediante la definición de cuatro niveles de calidad y la selección de variables que representan la realidad territorial. En total, se seleccionaron 20 variables, entre las cuales las más influyentes fueron el área del terreno (alfanumérica y digital), el folio de matrícula, el tipo de dominio y la destinación económica. Las variables con mayor inconsistencia fueron el área registral, el área catastral, la información de nombre completo, y los registros de personas jurídicas y naturales, así como la discrepancia entre el área registral y la calculada. Los cuatro niveles se dividen en la verificación de la totalidad de la información, la estructura del número predial nacional, el cumplimiento de reglas de consistencia y validaciones de topológicas. De los datos de los predios evaluados, un 70% cumple con los parámetros de calidad, lo que revela una necesidad implementar nuevos procesos, como el presentado, para de manejo y registro de información de manera más adecuada. Adicional a esto el desempeño del modelo tuvo un RSME del 0.0317, un MAE del 0.0185 y un R2 Score de 0.6629, lo que indica buen desempeño, cercanía a valores reales con los predichos y variabilidad en los datos con posibilidades de mejora.In the context of cadastral updates in Colombia and their importance for governmental decision-making, data quality plays a crucial role in the proper development of cadastral processes. It is necessary to streamline these processes, make them more efficient, and avoid inconsistencies as defined in the quality models set by the Agustín Codazzi Geographic Institute (IGAC) to advance in these processes. The application of technologies such as machine learning helps increase efficiency in these procedures. As a solution, a machine learning model was proposed to verify the quality of cadastral data in municipalities of the Casanare department through the definition of four quality levels, and the selection of variables that represent the territorial reality. In total, 20 variables were selected, among which the most influential were land area (alphanumeric and digital), property registration number, type of domain, and economic purpose. The variables with the most inconsistencies were registry area, cadastral area, complete name information, and records of legal and natural persons, as well as the discrepancy between the registered area and the calculated area. The four levels are divided into the verification of the completeness of the information, the structure of the national cadastral number, the compliance with consistency rules, and topological validations. Of the evaluated property data, 70% meets the quality parameters, which reveals a need to implement new processes, like the one presented, for more adequate data management and recording. Additionally, the model's performance had an RMSE of 0.0317, an MAE of 0.0185, and an R² Score of 0.6629, indicating good performance, closeness of predicted values to real values, and variability in the data with room for improvement.pdfspaAprendizaje de maquinaCalidad de datos catastralesVerificación de datosAnálisis geoespacialActualización catastralModelo de aprendizaje de máquina para la verificación de la calidad de los datos en actualizaciones catastrales en municipios de CasanarebachelorThesisIngeniería Catastral y Geodesia -- Tesis y disertaciones académicasAnálisis de información -- InformaciónReconocimientos topográficos -- TopografíaProcesamiento electrónico de datos -- Bases de datosOpenAccessMachine learning model for data quality verification in cadastral updates in the municipalities of CasanareMachine learningCadastral data qualityData verificationGeospatial analysisCadastral updateAbierto (Texto Completo)