Desarrollo de un modelo basado en machine learning para pronosticar el número de usuarios de televisión por suscripción para el departamento de Cundinamarca
| dc.contributor.advisor | Pedraza Martínez, Luis Fernando | |
| dc.contributor.author | Barrera Estepa, Andres Felipe | |
| dc.contributor.author | Gallego Valcárcel, Fabian Andres | |
| dc.date.accessioned | 2025-07-15T00:23:22Z | |
| dc.date.available | 2025-07-15T00:23:22Z | |
| dc.date.created | 2025-06-16 | |
| dc.description | En Colombia, la dinámica de la televisión por suscripción ha cambiado significativamente debido a la creciente competencia de plataformas de streaming y la diversidad geográfica del país. Este fenómeno plantea la necesidad de modelos predictivos que permitan anticipar el comportamiento de los abonados a estos servicios. En respuesta, el presente proyecto de grado, bajo la modalidad de monografía, propone el desarrollo de un modelo basado en técnicas de machine learning para pronosticar el número de usuarios de televisión por suscripción específicamente en el departamento de Cundinamarca. La metodología implementada en este proyecto se centra en la utilización de la librería Prophet de Meta (Facebook), reconocida por su eficacia en el modelado de series temporales con patrones estacionales y tendencias de largo plazo. Prophet permite un ajuste flexible de componentes como la tendencia y la estacionalidad, facilitando su aplicación en escenarios de telecomunicaciones donde los datos presentan variaciones recurrentes a lo largo del tiempo. La elección de esta herramienta responde a su facilidad de implementación, su capacidad para manejar datos faltantes y su robustez frente a cambios abruptos [1]. Para la construcción del modelo, se utilizó información histórica proveniente del Dashboard “Suscriptores de TV por Suscripción” de la Comisión de Regulación de Comunicaciones (CRC), que proporciona datos desagregados por tecnologías (HFC Digital, Satelital, IPTV, entre otros) y zonas geográficas. A partir de estos datos, se llevaron a cabo procesos de análisis exploratorio de datos (EDA), normalización de variables y selección de características relevantes, preparando así el conjunto de datos que alimentaría el modelo predictivo. Los resultados obtenidos incluyen no solo la proyección de la cantidad de nuevos suscriptores, sino también la identificación de patrones significativos en el comportamiento de contratación del servicio, considerando factores como la tecnología utilizada, el estrato socioeconómico y la ubicación geográfica de los usuarios. Además, el modelo predictivo basado en Prophet evidenció un desempeño sólido, reflejado en métricas como el error absoluto medio (MAE) y el error cuadrático medio (RMSE). Se logró anticipar el comportamiento de la cantidad de usuarios de televisión por suscripción para los próximos 6 a 12 meses. En conclusión, el desarrollo de este modelo no solo aporta una herramienta estratégica para los operadores de telecomunicaciones, sino que también ofrece una base sólida para el diseño de políticas públicas orientadas a la inclusión digital y la mejora del acceso a servicios TIC en Cundinamarca. Futuras líneas de investigación podrían incorporar variables socioeconómicas adicionales o explorar modelos híbridos que integren Prophet con redes neuronales recurrentes (RNN) para perfeccionar aún más la precisión de las predicciones. | |
| dc.description.abstract | In Colombia, the landscape of subscription television has undergone significant changes due to increasing competition from streaming platforms and the country's geographical diversity. This phenomenon highlights the need for predictive models that anticipate subscriber behavior. In response, this monograph-based research project proposes the development of a machine learning model to forecast the number of subscription television users in the department of Cundinamarca. The methodology centers on the use of Meta’s (Facebook) Prophet library, renowned for its effectiveness in modeling time series with seasonal patterns and long-term trends. Prophet enables flexible adjustments of trend and seasonality components, making it particularly suitable for telecommunications data, where recurring variations over time are common. The choice of this tool is based on its ease of implementation, ability to handle missing data, and robustness against sudden changes. To build the model, historical data from the “Subscription TV Subscribers” Dashboard of the Communications Regulation Commission (CRC) was utilized. This dataset provides disaggregated information based on technology types (HFC Digital, Satellite, IPTV, among others) and geographical zones. Through exploratory data analysis (EDA), variable normalization, and feature selection, the dataset was prepared to feed the predictive model. The results not only provide projections for new subscriber numbers but also identify significant patterns in service subscription behavior. Key influencing factors include technology type, socioeconomic strata, and the geographical location of users. Additionally, the Prophet-based predictive model demonstrated solid performance, reflected in metrics such as Mean Absolute Error (MAE) and Root Mean Square Error (RMSE), successfully forecasting subscription television user trends for the next 6 to 12 months. In conclusion, the development of this model serves as a strategic tool for telecommunications operators and establishes a robust foundation for public policy design focused on digital inclusion and improved access to ICT services in Cundinamarca. Future research directions could integrate additional socioeconomic variables or explore hybrid models combining Prophet with Recurrent Neural Networks (RNNs) to further refine prediction accuracy. Let me know if you need refinements! | |
| dc.format.mimetype | ||
| dc.identifier.uri | http://hdl.handle.net/11349/98202 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Distrital Francisco José de Caldas | |
| dc.relation.references | Taylor, S. J., & Letham, B. (2018). Forecasting at scale. The American Statistician, 72(1), 37-45. https://www.researchgate.net/publication/344989540_Forecasting_at_scale | |
| dc.relation.references | Comisión de Regulación de Comunicaciones, "Colombia alcanzó 6,3 millones de abonados al servicio de televisión por suscripción en 2022," CRC, 2024. [En línea]. Disponible en: https://www.crcom.gov.co/es/noticias/comunicado-prensa/colombia-alcanzo-63-millones-abonados-al-servicio-television-por | |
| dc.relation.references | T. M. Mitchell, Machine Learning. New York, NY, USA: McGraw-Hill, 1997 | |
| dc.relation.references | R. J. Hyndman and G. Athanasopoulos, Forecasting: Principles and Practice, 2nd ed., OTexts, 2018 | |
| dc.relation.references | Comisión de Regulación de Comunicaciones (CRC), "Dashboard Suscriptores de TV por Suscripción," [En línea]. Disponible en: https://www.crcom.gov.co | |
| dc.relation.references | A. Altin, A. Oztaysi, and E. Zaim, "Churn Management in Telecommunications: Hybrid Approach Using Cluster Analysis and Decision Trees," Journal of Risk and Financial Management, vol. 14, no. 11, p. 544, 2021. [Online]. Available: https://www.econstor.eu/bitstream/10419/258647/1/jrfm-14-00544.pdf | |
| dc.relation.references | A. Altin, A. Oztaysi, and E. Zaim, "Churn Management in Telecommunications: Hybrid Approach Using Cluster Analysis and Decision Trees," Journal of Risk and Financial Management, vol. 14, no. 11, p. 544, 2021. [Online]. Available: https://www.econstor.eu/bitstream/10419/258647/1/jrfm-14-00544.pdf | |
| dc.relation.references | N. Gutiérrez Ramírez y Y. M. Pinto Marcelo, "Algoritmo de predicción de abandono de clientes de servicios fijos en telecomunicaciones basado en un conjunto de datos de la empresa IBM," Monografía de grado, Facultad Tecnológica, Ingeniería en Telecomunicaciones, Universidad Distrital Francisco José de Caldas, Bogotá D.C., Colombia, Ene. 2023. [En línea]. Disponible: https://repository.udistrital.edu.co/handle/11349/31594 | |
| dc.relation.references | N. D. Senthil Kumar, "OTT Subscriber Churn Prediction Using Machine Learning," Tesis de Maestría, California State University, San Bernardino, 2023. [En línea]. Disponible en: https://scholarworks.lib.csusb.edu/etd/1660/ | |
| dc.relation.references | J. D. Falla Arango, "Predicción de abandono de clientes en telecomunicaciones mediante el aprendizaje automático," Tesis de Maestría, Facultad de Ciencias Naturales e Ingeniería, Maestría en Ingeniería y Analítica de Datos, Universidad de Bogotá Jorge Tadeo Lozano, Bogotá D.C., Colombia, 2021. [En línea]. Disponible: https://expeditiorepositorio.utadeo.edu.co/handle/20.500.12010/22247 | |
| dc.relation.references | L. F. Castillo and M. A. Flórez, Análisis estadístico y pronóstico para el servicio de internet móvil en Colombia usando ML, Universidad Distrital, 2024. R. Osorio, “Predicción del consumo del ancho de banda de las aplicaciones web en la nube nativa basada en Machine Learning,” Universidad Distrital Francisco José de Caldas, Colombia, 2020. | |
| dc.relation.references | R. Osorio, “Predicción del consumo del ancho de banda de las aplicaciones web en la nube nativa basada en Machine Learning,” Universidad Distrital Francisco José de Caldas, Colombia, 2020. | |
| dc.relation.references | T. Akerblom, “Predicting bankruptcy with machine learning models,” Uppsala Universitet, Suecia, 2020 | |
| dc.relation.references | D. Martínez y R. Meneses, “Implementacion de un algoritmo de machine learning supervisado,” Universidad Distrital Francisco José de Caldas, Bogotá, Colombia, 2020. T. Mitchell, “Machine Learning,” WCB/McGraw-Hill, 1991. [En línea]. Disponible: https://www.cin.ufpe.br/~cavmj/Machine%20-%20Learning%20-%20Tom%20Mitchell.pdf | |
| dc.relation.references | S. Afrin, “Supervised machine learning based liver disease prediction approach with LASSO feature selection,” Bulletin of Electrical Engineering and Informatics, vol. 10, 2021. | |
| dc.relation.references | O. Theobald, “Machine Learning For Absolute Beginners,” 2nd ed., 2017. [En línea]. Disponible: https://bmansoori.ir/book/Machine%20Learning%20For%20Absolute%20Beginners.pdf | |
| dc.relation.references | Muhammad y Z. Yan, “SUPERVISED MACHINE LEARNING APPROACHES: A SURVEY,” 2020 | |
| dc.relation.references | “Aprendizaje por Refuerzo,” Advanced Tech Computing Group, UTPL, 2008. [En línea]. Disponible: https://advancedtech.wordpress.com/2008/08/08/aprendizaje-por-refuerzo/ | |
| dc.relation.references | R. López, “Machine Learning con Python,” 2015. [En línea]. Disponible: https://relopezbriega.github.io/blog/2015/10/10/machine-learning-con-python/ | |
| dc.relation.references | Agresti, “Una introducción al análisis de datos categóricos,” 2nd ed., John Wiley & Sons, Inc., New York, 2002. [En línea]. Disponible: https://mregresion.wordpress.com/wp-content/uploads/2012/08/agresti-introduction-to-categorical-data.pdf | |
| dc.relation.references | R. Aruna y K. Nirmala, “Construction of Decision Tree: Attribute Selection Measures,” International Journal of Advancements in Research & Technology, vol. 2, no. 4, 2013. [En línea]. Disponible: https://www.semanticscholar.org/paper/Construction-of-Decision-Tree-%3A-Attribute-Selection-devi%C2%B9-Nirmala%C2%B2/ed568ba3257f2066ad3a2597d1e6947d058463db | |
| dc.relation.references | R. Aruna y K. Nirmala, “Construction of Decision Tree: Attribute Selection Measures,” International Journal of Advancements in Research & Technology, vol. 2, no. 4, 2013. [En línea]. Disponible: https://www.semanticscholar.org/paper/Construction-of-Decision-Tree-%3A-Attribute-Selection-devi%C2%B9-Nirmala%C2%B2/ed568ba3257f2066ad3a2597d1e6947d058463db | |
| dc.relation.references | “Cómo funciona el algoritmo XGBoost,” [En línea]. Disponible: https://pro.arcgis.com/es/pro-app/latest/tool-reference/geoai/how-xgboost-works.htm | |
| dc.relation.references | L. Gonzalez, “Aprendizaje Supervisado: Support Vector Machine,” 2018. [En línea]. Disponible: https://aprendeia.com/aprendizaje-supervisado-support-vector-machine | |
| dc.relation.references | K. M. Leung, “Naive Bayesian Classifier,” 2007. [En línea]. Disponible: https://cse.engineering.nyu.edu/~mleung/FRE7851/f07/naiveBayesianClassifier.pdf | |
| dc.relation.references | “Cuáles son los tipos de algoritmos del machine learning,” 2019. [En línea]. Disponible: https://www.apd.es/algoritmos-del-machine-learning/ | |
| dc.relation.references | “¿Qué es el sobreajuste?,” AWS, 2021. [En línea]. Disponible: https://aws.amazon.com/es/what-is/overfitting/ | |
| dc.relation.references | B. Juba y H. Le, “Precision-Recall versus Accuracy and the Role of Large Data Sets,” Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, pp. 4039, 2019. [En línea]. Disponible: https://doi.org/10.1609/aaai.v33i01.33014039 | |
| dc.relation.references | M. Marqués, “Bases de Datos,” Universitat Jaume I, Castelló de la Plana, España, 1st ed., 2011. [En línea]. Disponible: https://bdigital.uvhm.edu.mx/wp-content/uploads/2020/05/Bases-de-Datos.pdf | |
| dc.relation.references | Challenger, Y. Díaz y R. Becerra, “El lenguaje de programación Python,” Ciencias Holguín, Red de Revistas Científicas de América Latina, el Caribe, España y Portugal, vol. XX, Cuba, 2014. [En línea]. Disponible: https://www.redalyc.org/articulo.oa?id=181531232001 | |
| dc.relation.references | “Spyder. The Scientific Python Development Environment,” [En línea]. Disponible: https://www.spyder-ide.org/ | |
| dc.relation.references | “7 Best Python IDE for Data Science and Machine Learning Projects,” [En línea]. Disponible: https://www.projectpro.io/article/best-python-ide-for-data-science-and-machine-learning/812 | |
| dc.relation.references | R. Elmasri and S. B. Navathe, Fundamentals of Database Systems, 7th ed. Pearson, 2016 | |
| dc.relation.references | Comisión de Regulación de Comunicaciones (CRC), Resolución 5050 de 2016: Por la cual se compilan las disposiciones regulatorias aplicables a los servicios de telecomunicaciones, Bogotá, 2016 | |
| dc.relation.references | Comisión de Regulación de Comunicaciones (CRC), Resolución 6333 de 2021: Por la cual se modifica el Título de Reportes de Información, Bogotá, 2021. | |
| dc.relation.references | Congreso de la República de Colombia, Ley 1978 de 2019: Por la cual se moderniza el sector TIC, Diario Oficial No. 51.020, 25 de julio de 2019 | |
| dc.relation.references | Congreso de la República de Colombia, Ley 1712 de 2014: Ley de Transparencia y del Derecho de Acceso a la Información Pública Nacional, Diario Oficial No. 49.084, 6 de marzo de 2014. | |
| dc.relation.references | Ministerio de Ciencia, Tecnología e Innovación (MinCiencias), “Convocatoria 908 de 2021 – Proyectos de I+D+i para el fortalecimiento del sector TIC y audiovisual,” Bogotá, 2021. [En línea]. Disponible en: https://minciencias.gov.co/convocatorias | |
| dc.relation.references | Song YY, Lu Y. Decision tree methods: applications for classification and prediction. Shanghai Arch Psychiatry. 2015;27(2):130–135. doi: 10.11919 | |
| dc.relation.references | Salvador García, S., Luengo, J., & Herrera, F. (2016, octubre). Big Data: Preprocesamiento y calidad de datos. Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Granada (España). | |
| dc.rights.acceso | Abierto (Texto Completo) | |
| dc.rights.accessrights | OpenAccess | |
| dc.subject | Series Temporales | |
| dc.subject | Predicción de Suscriptores | |
| dc.subject | Telecomunicaciones | |
| dc.subject | MAPE | |
| dc.subject | MAE | |
| dc.subject.keyword | Time Series | |
| dc.subject.keyword | Subscriber Prediction | |
| dc.subject.keyword | Telecommunications | |
| dc.subject.keyword | MAPE | |
| dc.subject.keyword | MAE | |
| dc.subject.lemb | Ingeniería en Telecomunicaciones -- Tesis y disertaciones académicas | |
| dc.title | Desarrollo de un modelo basado en machine learning para pronosticar el número de usuarios de televisión por suscripción para el departamento de Cundinamarca | |
| dc.title.titleenglish | Development of a machine learning-based model to forecast the number of subscription television users in the department of Cundinamarca | |
| dc.type | bachelorThesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.degree | Monografía | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis |
Archivos
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 7 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
