Aplicación de tiempos de viaje como semimétrica en k-means para la agrupación y optimización de rutas

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

This work explores the adaptation of the K-means algorithm to use travel times as a semimetric, applied to the analysis of georeferenced data in an urban context, specifically in the city of Bogotá. By incorporating travel times obtained via the Google Directions API, the model allows the formation of clusters that reflect not only geographical proximity but also traffic conditions, making the clustering process more realistic in complex urban environments. To evaluate the quality of the clustering, validation indices such as the Silhouette index and the Davies-Bouldin index were employed, which indicated optimal configurations for the clusters. This approach contributes to logistical planning in the city and opens up opportunities for future research. Potential extensions include the use of georeferenced time series to capture traffic patterns throughout the day and the inclusion of different modes of transportation, such as public transit or walking. It is also proposed to investigate variations in the travel time semimetric, which could facilitate the use of advanced techniques such as spectral clustering, further enhancing the analysis of spatial data in urban applications.

Descripción

Este trabajo explora la adaptación del algoritmo K-means para utilizar tiempos de viaje como una semimétrica, aplicada al análisis de datos georreferenciados en un contexto urbano, específicamente en la ciudad de Bogotá. Incorporando los tiempos de desplazamiento obtenidos a través de la API de Google Directions, el modelo permite formar clústeres que reflejan no solo la proximidad geográfica, sino también las condiciones de tráfico, haciendo el proceso de clusterización más realista en entornos urbanos complejos. Para evaluar la calidad de la agrupación se emplearon índices de validación como el índice de Silueta y el índice de Davies-Bouldin, los cuales indicaron configuraciones óptimas para los clústeres. Este enfoque contribuye a la planificación logística en la ciudad y abre oportunidades para futuras investigaciones. Entre las posibles extensiones se encuentran el uso de series de tiempo georreferenciadas para capturar patrones de tráfico a lo largo del día y la inclusión de distintos modos de transporte, como el público o los desplazamientos a pie. También se propone investigar variaciones en la semimétrica de tiempos de viaje, lo cual podría facilitar el uso de técnicas avanzadas como el clustering espectral, mejorando aún más el análisis de datos espaciales en aplicaciones urbanas.

Palabras clave

K-means, Semimétrica, Datos geoespaciales, Tiempos de viaje, Clusterización urbana, API google direction

Materias

Matemáticas -- Tesis y disertaciones académicas , Algoritmos , Geografía -- Análisis espacial , Análisis cluster

Citación

Colecciones