Detección de fraudes en empresas de servicios públicos domiciliarios utilizando ciencia de datos y análisis geoespaciales

Miniatura

Fecha

Fecha

2023-12-04

Colaboradores

Título de la revista

ISSN de la revista

Título del volumen

Editor

Altmetric

Descripción

Uno de los grandes retos de cualquier empresa de distribución y comercialización de servicios públicos domiciliarios en el mundo es el control de perdidas, estas tienen diversas causas que suelen clasificarse como técnicas (propias de la operación del negocio y que se deben tener controladas) y no técnicas (asociadas a fraudes), afectando en mayor o menor grado temas como; inversiones para la expansión y mantenimiento de las redes, la rentabilidad de los accionistas e incluso la continuidad del servicio. Esta investigación propone una metodología para la detección de fraudes, clasificados como perdidas NO técnicas común a cualquier empresa de servicios públicos domiciliarios, basada en analítica de datos sobre información propia del negocio enriquecida con datos de terceros a través de análisis geoespaciales a partir de su ubicación geográfica y una segmentación por mercados, que permiten encontrar patrones sobre situaciones anómalas a través de modelos de machine learning supervisado y no supervisado. La metodología se implementó en una empresa de distribución de gas natural en Colombia y se contrasto contra metodologías propuestas por otros autores para empresas de distribución de energía eléctrica de otros países, que consideran que el problema debe ser abordado a partir de análisis de históricos de consumo y sus desviaciones. Los resultados obtenidos con la metodología propuesta mejoran la precisión y sensibilidad de los modelos en más del 20% y disminuyen los falsos negativos en el mismo porcentaje, facilitando la verificación y normalización de clientes en situaciones anómalas y/o fraudulentas.

Resumen

One of the great challenges of any utilities around the world is the control of losses, which have different causes that are usually classified as technical (accuracy of equipment, leaks and breaks, construction and maintenance procedures) and NON-technical (thefts and frauds), affecting issues such: as investments for the expansion and maintenance of the networks, the profitability of the shareholders and even the continuity of the service. This research proposes a methodology for the detection of NON-technical losses common to any utility company, based on data analytics on business information enriched with data from third parties through geospatial analysis from its geographic location and market segmentation, which allows finding patterns on anomalous situations through supervised (on historical information) and unsupervised (if no information is available) machine learning models. The results of different classification algorithms used in data analytics were analyzed and the one with the highest accuracy and lowest type two error rates (false negatives) was selected to perform field verification work. The methodology was implemented in a natural gas distribution company and was contrasted with methodologies proposed by other authors for electric energy distribution companies, who consider that the problem should be addressed based on an analysis of historical consumption and its deviations. The results obtained with the proposed methodology improve the accuracy and sensitivity of the models by more than 20% and decrease false negatives by the same percentage, facilitating the verification and normalization of customers in anomalous situations and/or fraudulent conditions.

Palabras clave

Analisis de Datos, Analisis Geoespacial, Detección de Fraudes, Ciencias de la Información, Servicios Públicos, Pérdidas No Técnicas

Materias

Maestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas , Protección de datos , Análisis de datos , Servicios públicos domiciliarios -- Medidas de seguridad , Mineria de datos , Datos espaciales

Citación