Exploración de las capacidades del modelo Segment Anything Model v2 (SAM 2) para la segmentación de fachadas en el entorno urbano de Bogotá a partir de imágenes de Google Street View

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

This undergraduate project addresses the problem of cadastral obsolescence in Colombia and its impact on urban planning, tax equity, and territorial management. Within this framework, it explores the capabilities of the foundation model Segment Anything Model v2 (SAM-2) for the automatic segmentation of urban façades using Google Street View imagery, considering façades as key elements in the estimation of real estate market value. The methodological approach included two phases: binary segmentation (façade vs. non-façade) and multiclass segmentation (façade, doors, windows, and meters), assessed through quantitative metrics such as IoU, Dice, precision, recall, and accuracy, complemented with qualitative expert validation. Results show that SAM-2 performs well in general façade identification, although it faces limitations with small or less represented elements in the images. The study concludes that foundation computer vision models provide valuable support for mass appraisal processes within the Multipurpose Cadastre framework, enhancing objectivity, scalability, and cost-efficiency in data collection. Finally, recommendations and future research lines are proposed, aiming to scale these techniques towards material classification, conservation state analysis, and the extraction of geometric metrics relevant for property valuation.

Descripción

El presente proyecto de grado aborda la problemática de la desactualización catastral en Colombia y sus implicaciones en la planeación urbana, la equidad tributaria y la gestión territorial. En este marco, se exploran las capacidades del modelo fundacional Segment Anything Model v2 (SAM-2) para la segmentación automática de fachadas urbanas a partir de imágenes de Google Street View, considerando la fachada como un elemento clave en la estimación del valor comercial de los inmuebles. El estudio adopta un enfoque metodológico basado en dos fases: segmentación binaria (fachada vs. no fachada) y segmentación multiclase (fachada, puertas, ventanas y contadores), evaluadas mediante métricas cuantitativas como IoU, Dice, precisión, exhaustividad y exactitud, complementadas con validación cualitativa de expertos. Los resultados evidencian que SAM-2 presenta un desempeño sobresaliente en la identificación general de fachadas, aunque se observan limitaciones frente a elementos pequeños o de baja representación en la imagen. La investigación concluye que el uso de modelos fundacionales de visión por computador constituye un insumo valioso para fortalecer los procesos de avalúo catastral en el marco del Catastro Multipropósito, al aportar objetividad, escalabilidad y reducción de costos en la recolección de datos. Finalmente, se plantean recomendaciones y líneas de investigación futura orientadas a escalar estas técnicas hacia la clasificación de materiales, el análisis del estado de conservación y la generación de métricas geométricas útiles para la valoración inmobiliaria.

Palabras clave

catastro multipropósito, segmentación de imágenes, SAM-2, Google Street View, avalúo catastral, visión por computador

Materias

Ingeniería Catastral y Geodesia -- Tesis y disertaciones académicas

Citación