Código de Python para la geocodificación de avisos por daños en la EAAB
Fecha
Fecha
2021-10-04
Autores
Director
Colaboradores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Altmetric
Descripción
Los servicios de geocodificación son usados a nivel mundial, sin embargo para la geocodificación masiva de direcciones presentan limitaciones en cuanto a cantidad de registros que permiten, y los algoritmos de búsqueda que presentan. Ahora bien, en la Empresa de Acueducto y alcantarillado de Bogotá, los operarios que atienden daños en la infraestructura escriben las direcciones de la atención de distintas maneras y agregando notas que no hacen parte de la estructura normalizada; por ello fue necesario crear un código de Python que permita normalizar las direcciones a una estructura adecuada, de la manera más rápida y que aporte buenos resultados, y que permita utilizar los servicios distritales para la búsqueda de direcciones, SIMUR, en este caso. Para ello fue necesario separar los elementos de las bases de datos obtenidas en la empresa, reconocer los errores que presentaban al escribir las direcciones y con base en ello crear un código con funciones básicas que a través de distintas combinaciones filtre y elimine los datos que no corresponden a la dirección, y posteriormente organice la información conforme a la estructura, para que esta pueda ser geo codificada adecuadamente, aumentando el porcentaje de coincidencias y la exactitud posicional en la búsqueda de datos puntuales.
Resumen
Geocoding services are used worldwide, but for the massive geocoding of addresses they have limitations in terms of the number of records they allow and the search algorithms they present. Now, in the Empresa de Acueducto y alcantarillado de Bogotá - EAAB, the operators that attend damages in the infrastructure write the addresses of the attention in different ways and adding notes that are not part of the normalized structure; for this reason it was necessary to create a Python code that allows to normalize the addresses to a suitable structure, in the fastest way and that provides good results, and that allows to use the district services for the search of addresses, SIMUR, in this case. To do this, it was necessary to separate the elements of the databases obtained in the company, recognize the errors that were present when writing the addresses and based on this create a code with basic functions that through different combinations filter and eliminate the data that do not correspond to the address, and then organize the information according to the structure, so that it can be properly geo-coded, increasing the percentage of matches and positional accuracy in the search for specific data.
Palabras clave
Python, Normalización, Direcciones, geocodificación