Creación de un dataset sobre coberturas del suelo en el oriente antioqueño – caso de estudio: Cocorná, Carmen de Viboral, Granada y Sonsón

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

The main objective of this research project is to create a dataset on land cover in Eastern Antioquia, with case studies in Cocorná, Carmen de Viboral, Granada, and Sonsón. This study highlights the lack of updated, georeferenced land use information, which poses a challenge for territorial and environmental planning. To address this need, the research project proposes creating the dataset using satellite image processing, segmentation, manual labeling, and deep learning techniques. Using the Google Earth Engine platform, images were collected, processed, augmented, and divided into small 96x96 pixel patches. These were then manually labeled into five land cover categories: Forests and semi-natural areas, agricultural land, artificial land, road network, and water bodies. To theoretically represent the categories, a formal ontology was developed using the Methodology methodology and implemented in Protegé software The MobileNetV2 architecture was used, which is a convolutional neural network (CNN) trained with more than 20,000 images organized by class. The model was validated with 20% of the total set. The results showed that the model achieved an accuracy of 76%. The classes with the best predictions were artificial land and agricultural land. However, there were problems predicting the class corresponding to forests and semi-natural areas, which was the class with the worst prediction. The road network class also had low accuracy, as it was poorly represented in the original dataset, necessitating the application of data augmentation strategies. Finally, the water surface class performed well in terms of model accuracy.

Descripción

Este trabajo de investigación tiene como objetivo principal la creación de un conjunto de datos, también llamado dataset, sobre las coberturas del suelo en el Oriente antioqueño, con caso de estudio en Cocorná, Carmen de Viboral, Granada y Sonsón, donde puede evidenciarse la falta de información georreferenciada y actualizada del uso del suelo, lo que supone un inconveniente para la planificación territorial y ambiental. Para atender dicha necesidad, el trabajo de investigación propone la elaboración del dataset a partir de técnicas de procesamiento de imágenes satelitales, segmentación, etiquetado manual y aprendizaje profundo (Deep Learning). Mediante la plataforma de Google Earth Engine se recopilaron imágenes que fueron procesadas, aumentadas y divididas en pequeños parches de 96x96 píxeles, que posteriormente se etiquetaron manualmente en cinco categorías de cobertura: bosques y áreas seminaturales, territorios agrícolas, territorios artificializados, red vial y superficies de agua. Para representar teóricamente las categorías, se desarrolló una ontología formal usando la metodología Methontology, la cual se implementó en el software Protégé. Se utilizó la arquitectura MobileNetV2, que es una red neuronal convolucional (CNN), entrenada con más de 20.000 imágenes organizadas por clase. El modelo fue validado con un 20% del conjunto total. Como resultado, se obtuvo que el modelo consiguió una precisión del 76%. Las clases con la mejor predicción fueron los territorios artificializados y los territorios agrícolas. Sin embargo, hubo dificultades en la predicción de la clase correspondiente a bosques y zonas seminaturales, que presentó el peor desempeño. Asimismo, la clase de red vial tuvo baja precisión debido a su escasa representación en el conjunto original de datos, lo que hizo necesario aplicar estrategias de aumento de datos. Finalmente, la clase de superficies de agua obtuvo buenos resultados en cuanto a la precisión del modelo.

Palabras clave

Dataset, Coberturas del suelo, Segmentación, Etiquetado, Aprendizaje profundo, MobileNetV2

Materias

Ingeniería Catastral y Geodesia -- Tesis y disertaciones académicas

Citación