Modelo de aprendizaje de máquina para la verificación de la calidad de los datos en actualizaciones catastrales en municipios de Casanare

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

In the context of cadastral updates in Colombia and their importance for governmental decision-making, data quality plays a crucial role in the proper development of cadastral processes. It is necessary to streamline these processes, make them more efficient, and avoid inconsistencies as defined in the quality models set by the Agustín Codazzi Geographic Institute (IGAC) to advance in these processes. The application of technologies such as machine learning helps increase efficiency in these procedures. As a solution, a machine learning model was proposed to verify the quality of cadastral data in municipalities of the Casanare department through the definition of four quality levels, and the selection of variables that represent the territorial reality. In total, 20 variables were selected, among which the most influential were land area (alphanumeric and digital), property registration number, type of domain, and economic purpose. The variables with the most inconsistencies were registry area, cadastral area, complete name information, and records of legal and natural persons, as well as the discrepancy between the registered area and the calculated area. The four levels are divided into the verification of the completeness of the information, the structure of the national cadastral number, the compliance with consistency rules, and topological validations. Of the evaluated property data, 70% meets the quality parameters, which reveals a need to implement new processes, like the one presented, for more adequate data management and recording. Additionally, the model's performance had an RMSE of 0.0317, an MAE of 0.0185, and an R² Score of 0.6629, indicating good performance, closeness of predicted values to real values, and variability in the data with room for improvement.

Descripción

En el contexto de la actualización catastral en Colombia y su importancia para la toma de decisiones gubernamentales, la calidad de los datos desempeña un papel crucial en el desarrollo adecuado de los procesos catastrales. Es necesario agilizar estos procesos, hacerlos más eficientes y evitar las inconsistencias establecidas en los modelos de calidad definidos por el Instituto Geográfico Agustín Codazzi (IGAC) para avanzar en dichos procesos. La aplicación de tecnologías como el aprendizaje maquina contribuye a aumentar la eficiencia en estos procedimientos. Como solución, se propuso un modelo de aprendizaje de maquina para verificar la calidad de los datos catastrales de municipios del departamento de Casanare mediante la definición de cuatro niveles de calidad y la selección de variables que representan la realidad territorial. En total, se seleccionaron 20 variables, entre las cuales las más influyentes fueron el área del terreno (alfanumérica y digital), el folio de matrícula, el tipo de dominio y la destinación económica. Las variables con mayor inconsistencia fueron el área registral, el área catastral, la información de nombre completo, y los registros de personas jurídicas y naturales, así como la discrepancia entre el área registral y la calculada. Los cuatro niveles se dividen en la verificación de la totalidad de la información, la estructura del número predial nacional, el cumplimiento de reglas de consistencia y validaciones de topológicas. De los datos de los predios evaluados, un 70% cumple con los parámetros de calidad, lo que revela una necesidad implementar nuevos procesos, como el presentado, para de manejo y registro de información de manera más adecuada. Adicional a esto el desempeño del modelo tuvo un RSME del 0.0317, un MAE del 0.0185 y un R2 Score de 0.6629, lo que indica buen desempeño, cercanía a valores reales con los predichos y variabilidad en los datos con posibilidades de mejora.

Palabras clave

Aprendizaje de maquina, Calidad de datos catastrales, Verificación de datos, Análisis geoespacial, Actualización catastral

Materias

Ingeniería Catastral y Geodesia -- Tesis y disertaciones académicas , Análisis de información -- Información , Reconocimientos topográficos -- Topografía , Procesamiento electrónico de datos -- Bases de datos

Citación