Desarrollo de un modelo basado en machine learning para pronosticar el número de usuarios de televisión por suscripción para el departamento de Cundinamarca

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

In Colombia, the landscape of subscription television has undergone significant changes due to increasing competition from streaming platforms and the country's geographical diversity. This phenomenon highlights the need for predictive models that anticipate subscriber behavior. In response, this monograph-based research project proposes the development of a machine learning model to forecast the number of subscription television users in the department of Cundinamarca. The methodology centers on the use of Meta’s (Facebook) Prophet library, renowned for its effectiveness in modeling time series with seasonal patterns and long-term trends. Prophet enables flexible adjustments of trend and seasonality components, making it particularly suitable for telecommunications data, where recurring variations over time are common. The choice of this tool is based on its ease of implementation, ability to handle missing data, and robustness against sudden changes. To build the model, historical data from the “Subscription TV Subscribers” Dashboard of the Communications Regulation Commission (CRC) was utilized. This dataset provides disaggregated information based on technology types (HFC Digital, Satellite, IPTV, among others) and geographical zones. Through exploratory data analysis (EDA), variable normalization, and feature selection, the dataset was prepared to feed the predictive model. The results not only provide projections for new subscriber numbers but also identify significant patterns in service subscription behavior. Key influencing factors include technology type, socioeconomic strata, and the geographical location of users. Additionally, the Prophet-based predictive model demonstrated solid performance, reflected in metrics such as Mean Absolute Error (MAE) and Root Mean Square Error (RMSE), successfully forecasting subscription television user trends for the next 6 to 12 months. In conclusion, the development of this model serves as a strategic tool for telecommunications operators and establishes a robust foundation for public policy design focused on digital inclusion and improved access to ICT services in Cundinamarca. Future research directions could integrate additional socioeconomic variables or explore hybrid models combining Prophet with Recurrent Neural Networks (RNNs) to further refine prediction accuracy. Let me know if you need refinements!

Descripción

En Colombia, la dinámica de la televisión por suscripción ha cambiado significativamente debido a la creciente competencia de plataformas de streaming y la diversidad geográfica del país. Este fenómeno plantea la necesidad de modelos predictivos que permitan anticipar el comportamiento de los abonados a estos servicios. En respuesta, el presente proyecto de grado, bajo la modalidad de monografía, propone el desarrollo de un modelo basado en técnicas de machine learning para pronosticar el número de usuarios de televisión por suscripción específicamente en el departamento de Cundinamarca. La metodología implementada en este proyecto se centra en la utilización de la librería Prophet de Meta (Facebook), reconocida por su eficacia en el modelado de series temporales con patrones estacionales y tendencias de largo plazo. Prophet permite un ajuste flexible de componentes como la tendencia y la estacionalidad, facilitando su aplicación en escenarios de telecomunicaciones donde los datos presentan variaciones recurrentes a lo largo del tiempo. La elección de esta herramienta responde a su facilidad de implementación, su capacidad para manejar datos faltantes y su robustez frente a cambios abruptos [1]. Para la construcción del modelo, se utilizó información histórica proveniente del Dashboard “Suscriptores de TV por Suscripción” de la Comisión de Regulación de Comunicaciones (CRC), que proporciona datos desagregados por tecnologías (HFC Digital, Satelital, IPTV, entre otros) y zonas geográficas. A partir de estos datos, se llevaron a cabo procesos de análisis exploratorio de datos (EDA), normalización de variables y selección de características relevantes, preparando así el conjunto de datos que alimentaría el modelo predictivo. Los resultados obtenidos incluyen no solo la proyección de la cantidad de nuevos suscriptores, sino también la identificación de patrones significativos en el comportamiento de contratación del servicio, considerando factores como la tecnología utilizada, el estrato socioeconómico y la ubicación geográfica de los usuarios. Además, el modelo predictivo basado en Prophet evidenció un desempeño sólido, reflejado en métricas como el error absoluto medio (MAE) y el error cuadrático medio (RMSE). Se logró anticipar el comportamiento de la cantidad de usuarios de televisión por suscripción para los próximos 6 a 12 meses. En conclusión, el desarrollo de este modelo no solo aporta una herramienta estratégica para los operadores de telecomunicaciones, sino que también ofrece una base sólida para el diseño de políticas públicas orientadas a la inclusión digital y la mejora del acceso a servicios TIC en Cundinamarca. Futuras líneas de investigación podrían incorporar variables socioeconómicas adicionales o explorar modelos híbridos que integren Prophet con redes neuronales recurrentes (RNN) para perfeccionar aún más la precisión de las predicciones.

Palabras clave

Series Temporales, Predicción de Suscriptores, Telecomunicaciones, MAPE, MAE

Materias

Ingeniería en Telecomunicaciones -- Tesis y disertaciones académicas

Citación