Construcción de algoritmo para análisis de causa raíz de accidentes de tránsito utilizando redes neuronales y minería de datos.

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

Determining the root cause of transit accidents is crucial to understand events dynamic. There are a great number of techniques to do this. More of them implies the participation of stakeholders in transit accidents analysis, using their experience. Data mining is an emergent technology that can be used in the analysis and solution of different complexity problems, like traffic accidents. It allows experts to extract knowledge from the information in the data gathered in the accident site. In this work it has been employed two databases; the first contains 38 fields and 34628 registers and is available in (https://www.datos.gov.co/widgets/79fi-zm8c. The second one supplies information taken from Allianz traffic accidents files and includes only information of transportation companies. It has and 890 registers Root cause model has been divided in two sections; one for find the immediate cause and the other for search the possible root cause of the accidents. To do this it has been proposed three different algorithms: Multilayer Perceptron (MLP) and Naïve Bayes(NB) for the immediate cause and PART for the basic or root cause. Performing the data mining utilizes the free software WEKA 3.8. le evaluation of the performance of that algorithms is based on the use of metrics like percentage of hits and misses, kappa index, root mean square error, ROC, Concerning the immediate cause of the accidents for the first databe It has been found that Naïve Bayes performs better than ANN multiulayer perceptron, getting 76,44% of correctly classified instances while perceptron does 54,4%. For the second database, MLP got 72% of correctly classified instances. Finally, the models constructed from the algorithms related, was tested in a real case corresponding to a road a truck accident .

Descripción

La determinación de la causa de los accidentes de tránsito tiene una gran utilidad para comprender la dinámica de estos eventos. Existe una gran cantidad de técnicas aplicables que requieren la participación de personas involucradas de alguna manera con el análisis de accidentalidad vial y aprovechan su experiencia en este campo. La minería de datos es una tecnología emergente que se adapta a fenómenos de distinta complejidad como son los accidentes de tránsito y permiten utilizar la información contenida en los datos acumulados de accidentalidad y que por lo general administran las agencias del estado encargadas de formular políticas para disminuirla. En este trabajo se han utilizado dos base de datos de accidentalidad. La primera con 38 campos y 34628 registros o instancias disponible en el portal de datos abiertos. (https://www.datos.gov.co/widgets/79fi-zm8c) La segunda base de datos tiene información solamente de accidentes de tránsito en empresas de transporte. Para ello se ha utilizado información de empresas aseguradas con Allianz, como Coca Cola, transportes Iceberg, Transportes La Carolina, Pronavicola, Servientrega, Transmeta, Femsa logística, transporadora nacional de Coca Cola, Harinera del Valle, Sistema de tarnsporte masivo de Cali (MIO), Conalvías. Esta base de datos tiene información de 880 siniestros en diferentes ciudades y carretas nacionales. El modelo de causa raíz se ha dividido en dos partes, uno para encontrar la causa próxima y el otro para la causa raíz de los accidentes. Para ello Se han propuesto dos algoritmos para analizar los datos de estas bases; redes neuronales artificiales (perceptrón multicapas) y Naive Bayes, que sirven para clasificar los datos correspondientes a casos nuevos baja la etiqueta de causa de accidente. Se ha utilizado el software libre Weka. Se encuentra que el algoritmo Naive Bayes tiene un mejor desempeño que la red neuronal, la cual requiere una gran capacidad de procesamiento. La segunda parte para encontrar la posible causa raíz de los accidentes. Para ello se ha utilizado la base de datos 2 y el algoritmo PART. La validación de los modelos se ha realizado aplicando las métricas normalmente disponibles. Adicionalmente se ha analizado y aplicado el algoritmo al caso de siniestro de un vehículo de transportes Iceberg

Palabras clave

Accidentalidad vial, Minería de datos, Redes neuronales, Causa raíz, Causa inmediata, Weka

Materias

Especialización en Higiene, Seguridad y Salud en el Trabajo - Tesis y disertaciones académicas , Accidentes de transito , Minería de datos , Redes neuronales

Citación