Modelo de sistema de alerta temprana para desbordamientos de arroyos en Barranquilla basado en la comunidad

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

The present work seeks to design and create a community-based early warning model as an alternative to as an alternative for mitigating the disaster caused by overflowing streams in Barranquilla (Colombia). in Barranquilla (Colombia). This model is based on the contributions in social networks, which are consulted by means of the api of each social network and filtered according to their according to their location, The information collected is cleaned and debugged, and then with debugging, and then with natural language processing techniques to tokenize the texts, seeking to operate vectorize the texts, seeking to operate mathematically to find the vector similarity between processed texts, generating from between processed texts, generating in this way a classification between texts associated with stream associated with stream overflow and texts not associated with overflow. Additionally, the texts classified as stream overflow are processed again in order to obtain a location or assign a default one, in order to georeference these data on a map that georeferencing this data on a map that allows to associate the risk zone and visualize it in a web application, monitoring and decreasing and visualize it in a web application, monitoring and reducing the possible damage to the population. generated to the population. In order to choose the best classifier, 3 classification algorithms were selected (random forest, randomly generated and randomly generated). classification algorithms (random forest, extra tree and k-neigbor) were selected, which showed the best and R2 in reference to the data processed in the regressions performed. regressions. Finally, the three aforementioned algorithms were trained, found that the k-neighbor algorithm obtained 88 failures out of a test set of 400 tweets, being the one with the least number of failures. tweets, being this the one that obtained the least number of failures and selected for the proposed system.

Descripción

El presente trabajo busca diseñar y crear un modelo de alerta temprana basado en la comunidad como alternativa para la mitigación ante el desastre provocado por los arroyos que se desbordan en Barranquilla (Colombia). Este modelo se basa en los aportes en redes sociales, los cuales son consultados por medio de la api de cada red social y filtradas de acuerdo a su localización, con la información recolectada se realiza limpieza y depuración, para luego con técnicas de procesamiento de lenguaje natural tokenizar vectorizar los textos, buscando operar matemáticamente para encontrar la similitud vectorial entre textos procesados, generando de esta manera una clasificación entre textos asociados a desbordamiento de arroyo y textos que no asociados a desbordamiento. Adicionalmente los textos clasificados como desbordamiento de arroyo son procesados nuevamente con el fin de obtener una localización o asignarle una por defecto, para consecuentemente georreferenciar estos datos en un mapa que permita asociar la zona de riesgo y visualizarla en una aplicación web, monitoreando y disminuyendo el posible daño generado a la población. Con el fin de escoger el mejor clasificador, se seleccionaron 3 algoritmos de clasificación (random forest, extra tree y k-neigbor), los cuales presentaron mejor comportamiento y R2 en referencia a los datos procesado en las regresiones realizadas. Finalmente los tres algoritmos anteriormente mencionados fueron entrenados, encontrando que el algoritmo k-neighbor, obtuvo 88 fallos de un set de pruebas de 400 tweets, siendo este el que menos fallos obtuvo y seleccionado para el sistema propuesto.

Palabras clave

Desbordamiento, Redes sociales, Machine learning, Procesamiento de lenguaje natural

Materias

Maestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas , Modelos de alerta temprana basados en la comunidad , Mitigación de desastres por desbordamiento de arroyos , Procesamiento de lenguaje natural en redes sociales , Georreferenciación de riesgos en Barranquilla

Citación