Evaluación de redes neuronales convolucionales para la extracción de linderos prediales como herramienta para la actualización catastral

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

The training and validation process of machine learning models follows an iterative cycle composed of three main activities: input enlistment, model optimization, and results analysis. Enlistment includes data selection and preparation, while optimization focuses on the choice of architecture and the adjustment of model parameters, and finally, results analysis involves the calculation of metrics for model evaluation, where in the case of a non-optimal evaluation, an iterative optimization process must be performed to reach performance thresholds. In the study, the use of pre-trained models is proposed for the extraction of visible physical property boundaries in rural soil in Cundinamarca, for which 2 orthoimages corresponding to the municipalities of Tabio and Subachoque were chosen as inputs, which have a Ground Sample Distance less than 50 centimeters. In the case of Tabio, the roads, drains, walls and fences present in the official basic cartography of the municipality were used as elements of the boundary class, and for Subachoque, these elements were manually digitized. 145 tests were performed between the SegNet, Unet and ResNet models with tile datasets of 3 different sizes; 256x256, 512x512 and 2557x1887. Likewise, the window size, stride, batch size and number of epochs parameters were varied, in search of the optimal combination in terms of execution time and training and validation metrics. The values obtained for the evaluation metrics show that the UNET architecture achieves the best performance, as it stood out in the F1-Score and Kappa index values for both municipalities. However, as in any automated task, it is necessary to consider practical factors such as minimum machine requirements and execution time versus these parameters for the conventional capture of boundaries. Finally, the importance of the quality of the data set to guarantee the accuracy of the results is evident, therefore, improvement is suggested both in the selection and in the debugging of the input vector and raster data.

Descripción

El proceso de entrenamiento y validación de modelos de aprendizaje automático sigue un ciclo iterativo compuesto por tres actividades principales: alistamiento de los insumos, optimización del modelo y análisis de resultados. El alistamiento incluye la selección y preparación de datos, mientras que la optimización se enfoca en la elección de la arquitectura y el ajuste de los parámetros del modelo y finalmente el análisis de resultados involucra el cálculo de métricas para la evaluación del modelo, donde en el caso de una evaluación no óptima, se debe realizar un proceso iterativo de optimización para alcanzar los umbrales de desempeño. En el estudio, se plantea el uso de modelos pre entrenados para la extracción de linderos prediales físicos visibles en suelo rural de Cundinamarca, para lo cual se escogieron como insumos 2 ortoimágenes correspondientes a los municipios de Tabio y Subachoque que tienen un Ground Sample Distance inferior a 50 centímetros, en el caso de Tabio se utilizaron como elementos de la clase linderos las vías, drenajes, muros y cercas presentes en la cartografía básica oficial del municipio y para Subachoque se realizó la digitalización manual de estos elementos. Se realizaron 145 pruebas entre los modelos SegNet, Unet y ResNet con datasets de teselas de 3 tamaños distintos; 256x256, 512x512 y 2557x1887, así mismo, se variaron los parámetros de window size, stride, batch size y número de épocas, en búsqueda de la combinación óptima en términos de tiempo de ejecución y métricas de entrenamiento y de validación. Los valores obtenidos para las métricas de evaluación evidencian que la arquitectura UNET alcanza el mejor rendimiento, pues esta destacó en los valores de F1-Score e índice Kappa para ambos municipios, sin embargo, como en cualquier tarea automatizada, es necesario considerar los factores prácticos como requerimientos mínimos de la máquina y el tiempo de ejecución versus estos parámetros para la captura convencional de linderos. Finalmente, es evidente la importancia de la calidad del conjunto de datos para garantizar la precisión de los resultados, por lo cual, se sugiere la mejora tanto en la selección como en la depuración de los datos vectoriales y ráster de insumo.

Palabras clave

Redes neuronales convolucionales, Aprendizaje profundo, Lindero, Catastro

Materias

Ingeniería Catastral y Geodesia -- Tesis y disertaciones académicas , Redes neuronales convolucionales , Extracción automatizada de linderos prediales , Catastro -- Actualización

Citación