Detección de fraudes en empresas de servicios públicos domiciliarios utilizando ciencia de datos y análisis geoespaciales

dc.contributor.advisorMelo Martínez, Carlos Eduardo
dc.contributor.authorPachón Rodríguez, Willian Antonio
dc.contributor.orcid0000-0002-6570-8144spa
dc.contributor.orcid0000-0002-5598-1913spa
dc.contributor.orcidMelo Martínez, Carlos Eduardo [0000-0002-5598-1913]
dc.date.accessioned2024-02-20T18:11:30Z
dc.date.available2024-02-20T18:11:30Z
dc.date.created2023-12-04
dc.descriptionUno de los grandes retos de cualquier empresa de distribución y comercialización de servicios públicos domiciliarios en el mundo es el control de perdidas, estas tienen diversas causas que suelen clasificarse como técnicas (propias de la operación del negocio y que se deben tener controladas) y no técnicas (asociadas a fraudes), afectando en mayor o menor grado temas como; inversiones para la expansión y mantenimiento de las redes, la rentabilidad de los accionistas e incluso la continuidad del servicio. Esta investigación propone una metodología para la detección de fraudes, clasificados como perdidas NO técnicas común a cualquier empresa de servicios públicos domiciliarios, basada en analítica de datos sobre información propia del negocio enriquecida con datos de terceros a través de análisis geoespaciales a partir de su ubicación geográfica y una segmentación por mercados, que permiten encontrar patrones sobre situaciones anómalas a través de modelos de machine learning supervisado y no supervisado. La metodología se implementó en una empresa de distribución de gas natural en Colombia y se contrasto contra metodologías propuestas por otros autores para empresas de distribución de energía eléctrica de otros países, que consideran que el problema debe ser abordado a partir de análisis de históricos de consumo y sus desviaciones. Los resultados obtenidos con la metodología propuesta mejoran la precisión y sensibilidad de los modelos en más del 20% y disminuyen los falsos negativos en el mismo porcentaje, facilitando la verificación y normalización de clientes en situaciones anómalas y/o fraudulentas.spa
dc.description.abstractOne of the great challenges of any utilities around the world is the control of losses, which have different causes that are usually classified as technical (accuracy of equipment, leaks and breaks, construction and maintenance procedures) and NON-technical (thefts and frauds), affecting issues such: as investments for the expansion and maintenance of the networks, the profitability of the shareholders and even the continuity of the service. This research proposes a methodology for the detection of NON-technical losses common to any utility company, based on data analytics on business information enriched with data from third parties through geospatial analysis from its geographic location and market segmentation, which allows finding patterns on anomalous situations through supervised (on historical information) and unsupervised (if no information is available) machine learning models. The results of different classification algorithms used in data analytics were analyzed and the one with the highest accuracy and lowest type two error rates (false negatives) was selected to perform field verification work. The methodology was implemented in a natural gas distribution company and was contrasted with methodologies proposed by other authors for electric energy distribution companies, who consider that the problem should be addressed based on an analysis of historical consumption and its deviations. The results obtained with the proposed methodology improve the accuracy and sensitivity of the models by more than 20% and decrease false negatives by the same percentage, facilitating the verification and normalization of customers in anomalous situations and/or fraudulent conditions.spa
dc.format.mimetypepdfspa
dc.identifier.urihttp://hdl.handle.net/11349/33141
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.accesoAbierto (Texto Completo)spa
dc.rights.accessrightsOpenAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectAnalisis de Datosspa
dc.subjectAnalisis Geoespacialspa
dc.subjectDetección de Fraudesspa
dc.subjectCiencias de la Informaciónspa
dc.subjectServicios Públicosspa
dc.subjectPérdidas No Técnicasspa
dc.subject.keywordData Analysesspa
dc.subject.keywordGeoespatial Analysisspa
dc.subject.keywordFraud Detectionspa
dc.subject.keywordData Sciencespa
dc.subject.keywordUtilitiesspa
dc.subject.keywordNon Technical lossesspa
dc.subject.lembMaestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas
dc.subject.lembProtección de datos
dc.subject.lembAnálisis de datos
dc.subject.lembServicios públicos domiciliarios -- Medidas de seguridad
dc.subject.lembMineria de datos
dc.subject.lembDatos espaciales
dc.titleDetección de fraudes en empresas de servicios públicos domiciliarios utilizando ciencia de datos y análisis geoespacialesspa
dc.title.titleenglishFraud detection in utilities using data science and geospatial analysisspa
dc.typemasterThesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.degreeInvestigación-Innovaciónspa

Archivos

Bloque original

Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
Tesis de Maestria
Tamaño:
3.34 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
Licencia de uso y autorización
Tamaño:
197.46 KB
Formato:
Adobe Portable Document Format
Descripción:
Autorizacion Publicacion

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: