Desarrollo de un modelo basado en machine learning para pronosticar el número de usuarios de televisión por suscripción para el departamento de Cundinamarca

dc.contributor.advisorPedraza Martínez, Luis Fernando
dc.contributor.authorBarrera Estepa, Andres Felipe
dc.contributor.authorGallego Valcárcel, Fabian Andres
dc.date.accessioned2025-07-15T00:23:22Z
dc.date.available2025-07-15T00:23:22Z
dc.date.created2025-06-16
dc.descriptionEn Colombia, la dinámica de la televisión por suscripción ha cambiado significativamente debido a la creciente competencia de plataformas de streaming y la diversidad geográfica del país. Este fenómeno plantea la necesidad de modelos predictivos que permitan anticipar el comportamiento de los abonados a estos servicios. En respuesta, el presente proyecto de grado, bajo la modalidad de monografía, propone el desarrollo de un modelo basado en técnicas de machine learning para pronosticar el número de usuarios de televisión por suscripción específicamente en el departamento de Cundinamarca. La metodología implementada en este proyecto se centra en la utilización de la librería Prophet de Meta (Facebook), reconocida por su eficacia en el modelado de series temporales con patrones estacionales y tendencias de largo plazo. Prophet permite un ajuste flexible de componentes como la tendencia y la estacionalidad, facilitando su aplicación en escenarios de telecomunicaciones donde los datos presentan variaciones recurrentes a lo largo del tiempo. La elección de esta herramienta responde a su facilidad de implementación, su capacidad para manejar datos faltantes y su robustez frente a cambios abruptos [1]. Para la construcción del modelo, se utilizó información histórica proveniente del Dashboard “Suscriptores de TV por Suscripción” de la Comisión de Regulación de Comunicaciones (CRC), que proporciona datos desagregados por tecnologías (HFC Digital, Satelital, IPTV, entre otros) y zonas geográficas. A partir de estos datos, se llevaron a cabo procesos de análisis exploratorio de datos (EDA), normalización de variables y selección de características relevantes, preparando así el conjunto de datos que alimentaría el modelo predictivo. Los resultados obtenidos incluyen no solo la proyección de la cantidad de nuevos suscriptores, sino también la identificación de patrones significativos en el comportamiento de contratación del servicio, considerando factores como la tecnología utilizada, el estrato socioeconómico y la ubicación geográfica de los usuarios. Además, el modelo predictivo basado en Prophet evidenció un desempeño sólido, reflejado en métricas como el error absoluto medio (MAE) y el error cuadrático medio (RMSE). Se logró anticipar el comportamiento de la cantidad de usuarios de televisión por suscripción para los próximos 6 a 12 meses. En conclusión, el desarrollo de este modelo no solo aporta una herramienta estratégica para los operadores de telecomunicaciones, sino que también ofrece una base sólida para el diseño de políticas públicas orientadas a la inclusión digital y la mejora del acceso a servicios TIC en Cundinamarca. Futuras líneas de investigación podrían incorporar variables socioeconómicas adicionales o explorar modelos híbridos que integren Prophet con redes neuronales recurrentes (RNN) para perfeccionar aún más la precisión de las predicciones.
dc.description.abstractIn Colombia, the landscape of subscription television has undergone significant changes due to increasing competition from streaming platforms and the country's geographical diversity. This phenomenon highlights the need for predictive models that anticipate subscriber behavior. In response, this monograph-based research project proposes the development of a machine learning model to forecast the number of subscription television users in the department of Cundinamarca. The methodology centers on the use of Meta’s (Facebook) Prophet library, renowned for its effectiveness in modeling time series with seasonal patterns and long-term trends. Prophet enables flexible adjustments of trend and seasonality components, making it particularly suitable for telecommunications data, where recurring variations over time are common. The choice of this tool is based on its ease of implementation, ability to handle missing data, and robustness against sudden changes. To build the model, historical data from the “Subscription TV Subscribers” Dashboard of the Communications Regulation Commission (CRC) was utilized. This dataset provides disaggregated information based on technology types (HFC Digital, Satellite, IPTV, among others) and geographical zones. Through exploratory data analysis (EDA), variable normalization, and feature selection, the dataset was prepared to feed the predictive model. The results not only provide projections for new subscriber numbers but also identify significant patterns in service subscription behavior. Key influencing factors include technology type, socioeconomic strata, and the geographical location of users. Additionally, the Prophet-based predictive model demonstrated solid performance, reflected in metrics such as Mean Absolute Error (MAE) and Root Mean Square Error (RMSE), successfully forecasting subscription television user trends for the next 6 to 12 months. In conclusion, the development of this model serves as a strategic tool for telecommunications operators and establishes a robust foundation for public policy design focused on digital inclusion and improved access to ICT services in Cundinamarca. Future research directions could integrate additional socioeconomic variables or explore hybrid models combining Prophet with Recurrent Neural Networks (RNNs) to further refine prediction accuracy. Let me know if you need refinements!
dc.format.mimetypepdf
dc.identifier.urihttp://hdl.handle.net/11349/98202
dc.language.isospa
dc.publisherUniversidad Distrital Francisco José de Caldas
dc.relation.referencesTaylor, S. J., & Letham, B. (2018). Forecasting at scale. The American Statistician, 72(1), 37-45. https://www.researchgate.net/publication/344989540_Forecasting_at_scale
dc.relation.referencesComisión de Regulación de Comunicaciones, "Colombia alcanzó 6,3 millones de abonados al servicio de televisión por suscripción en 2022," CRC, 2024. [En línea]. Disponible en: https://www.crcom.gov.co/es/noticias/comunicado-prensa/colombia-alcanzo-63-millones-abonados-al-servicio-television-por
dc.relation.referencesT. M. Mitchell, Machine Learning. New York, NY, USA: McGraw-Hill, 1997
dc.relation.referencesR. J. Hyndman and G. Athanasopoulos, Forecasting: Principles and Practice, 2nd ed., OTexts, 2018
dc.relation.referencesComisión de Regulación de Comunicaciones (CRC), "Dashboard Suscriptores de TV por Suscripción," [En línea]. Disponible en: https://www.crcom.gov.co
dc.relation.referencesA. Altin, A. Oztaysi, and E. Zaim, "Churn Management in Telecommunications: Hybrid Approach Using Cluster Analysis and Decision Trees," Journal of Risk and Financial Management, vol. 14, no. 11, p. 544, 2021. [Online]. Available: https://www.econstor.eu/bitstream/10419/258647/1/jrfm-14-00544.pdf
dc.relation.referencesA. Altin, A. Oztaysi, and E. Zaim, "Churn Management in Telecommunications: Hybrid Approach Using Cluster Analysis and Decision Trees," Journal of Risk and Financial Management, vol. 14, no. 11, p. 544, 2021. [Online]. Available: https://www.econstor.eu/bitstream/10419/258647/1/jrfm-14-00544.pdf
dc.relation.referencesN. Gutiérrez Ramírez y Y. M. Pinto Marcelo, "Algoritmo de predicción de abandono de clientes de servicios fijos en telecomunicaciones basado en un conjunto de datos de la empresa IBM," Monografía de grado, Facultad Tecnológica, Ingeniería en Telecomunicaciones, Universidad Distrital Francisco José de Caldas, Bogotá D.C., Colombia, Ene. 2023. [En línea]. Disponible: https://repository.udistrital.edu.co/handle/11349/31594
dc.relation.referencesN. D. Senthil Kumar, "OTT Subscriber Churn Prediction Using Machine Learning," Tesis de Maestría, California State University, San Bernardino, 2023. [En línea]. Disponible en: https://scholarworks.lib.csusb.edu/etd/1660/
dc.relation.referencesJ. D. Falla Arango, "Predicción de abandono de clientes en telecomunicaciones mediante el aprendizaje automático," Tesis de Maestría, Facultad de Ciencias Naturales e Ingeniería, Maestría en Ingeniería y Analítica de Datos, Universidad de Bogotá Jorge Tadeo Lozano, Bogotá D.C., Colombia, 2021. [En línea]. Disponible: https://expeditiorepositorio.utadeo.edu.co/handle/20.500.12010/22247
dc.relation.referencesL. F. Castillo and M. A. Flórez, Análisis estadístico y pronóstico para el servicio de internet móvil en Colombia usando ML, Universidad Distrital, 2024. R. Osorio, “Predicción del consumo del ancho de banda de las aplicaciones web en la nube nativa basada en Machine Learning,” Universidad Distrital Francisco José de Caldas, Colombia, 2020.
dc.relation.referencesR. Osorio, “Predicción del consumo del ancho de banda de las aplicaciones web en la nube nativa basada en Machine Learning,” Universidad Distrital Francisco José de Caldas, Colombia, 2020.
dc.relation.referencesT. Akerblom, “Predicting bankruptcy with machine learning models,” Uppsala Universitet, Suecia, 2020
dc.relation.referencesD. Martínez y R. Meneses, “Implementacion de un algoritmo de machine learning supervisado,” Universidad Distrital Francisco José de Caldas, Bogotá, Colombia, 2020. T. Mitchell, “Machine Learning,” WCB/McGraw-Hill, 1991. [En línea]. Disponible: https://www.cin.ufpe.br/~cavmj/Machine%20-%20Learning%20-%20Tom%20Mitchell.pdf
dc.relation.referencesS. Afrin, “Supervised machine learning based liver disease prediction approach with LASSO feature selection,” Bulletin of Electrical Engineering and Informatics, vol. 10, 2021.
dc.relation.referencesO. Theobald, “Machine Learning For Absolute Beginners,” 2nd ed., 2017. [En línea]. Disponible: https://bmansoori.ir/book/Machine%20Learning%20For%20Absolute%20Beginners.pdf
dc.relation.referencesMuhammad y Z. Yan, “SUPERVISED MACHINE LEARNING APPROACHES: A SURVEY,” 2020
dc.relation.references“Aprendizaje por Refuerzo,” Advanced Tech Computing Group, UTPL, 2008. [En línea]. Disponible: https://advancedtech.wordpress.com/2008/08/08/aprendizaje-por-refuerzo/
dc.relation.referencesR. López, “Machine Learning con Python,” 2015. [En línea]. Disponible: https://relopezbriega.github.io/blog/2015/10/10/machine-learning-con-python/
dc.relation.referencesAgresti, “Una introducción al análisis de datos categóricos,” 2nd ed., John Wiley & Sons, Inc., New York, 2002. [En línea]. Disponible: https://mregresion.wordpress.com/wp-content/uploads/2012/08/agresti-introduction-to-categorical-data.pdf
dc.relation.referencesR. Aruna y K. Nirmala, “Construction of Decision Tree: Attribute Selection Measures,” International Journal of Advancements in Research & Technology, vol. 2, no. 4, 2013. [En línea]. Disponible: https://www.semanticscholar.org/paper/Construction-of-Decision-Tree-%3A-Attribute-Selection-devi%C2%B9-Nirmala%C2%B2/ed568ba3257f2066ad3a2597d1e6947d058463db
dc.relation.referencesR. Aruna y K. Nirmala, “Construction of Decision Tree: Attribute Selection Measures,” International Journal of Advancements in Research & Technology, vol. 2, no. 4, 2013. [En línea]. Disponible: https://www.semanticscholar.org/paper/Construction-of-Decision-Tree-%3A-Attribute-Selection-devi%C2%B9-Nirmala%C2%B2/ed568ba3257f2066ad3a2597d1e6947d058463db
dc.relation.references“Cómo funciona el algoritmo XGBoost,” [En línea]. Disponible: https://pro.arcgis.com/es/pro-app/latest/tool-reference/geoai/how-xgboost-works.htm
dc.relation.referencesL. Gonzalez, “Aprendizaje Supervisado: Support Vector Machine,” 2018. [En línea]. Disponible: https://aprendeia.com/aprendizaje-supervisado-support-vector-machine
dc.relation.referencesK. M. Leung, “Naive Bayesian Classifier,” 2007. [En línea]. Disponible: https://cse.engineering.nyu.edu/~mleung/FRE7851/f07/naiveBayesianClassifier.pdf
dc.relation.references“Cuáles son los tipos de algoritmos del machine learning,” 2019. [En línea]. Disponible: https://www.apd.es/algoritmos-del-machine-learning/
dc.relation.references“¿Qué es el sobreajuste?,” AWS, 2021. [En línea]. Disponible: https://aws.amazon.com/es/what-is/overfitting/
dc.relation.referencesB. Juba y H. Le, “Precision-Recall versus Accuracy and the Role of Large Data Sets,” Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, pp. 4039, 2019. [En línea]. Disponible: https://doi.org/10.1609/aaai.v33i01.33014039
dc.relation.referencesM. Marqués, “Bases de Datos,” Universitat Jaume I, Castelló de la Plana, España, 1st ed., 2011. [En línea]. Disponible: https://bdigital.uvhm.edu.mx/wp-content/uploads/2020/05/Bases-de-Datos.pdf
dc.relation.referencesChallenger, Y. Díaz y R. Becerra, “El lenguaje de programación Python,” Ciencias Holguín, Red de Revistas Científicas de América Latina, el Caribe, España y Portugal, vol. XX, Cuba, 2014. [En línea]. Disponible: https://www.redalyc.org/articulo.oa?id=181531232001
dc.relation.references“Spyder. The Scientific Python Development Environment,” [En línea]. Disponible: https://www.spyder-ide.org/
dc.relation.references“7 Best Python IDE for Data Science and Machine Learning Projects,” [En línea]. Disponible: https://www.projectpro.io/article/best-python-ide-for-data-science-and-machine-learning/812
dc.relation.referencesR. Elmasri and S. B. Navathe, Fundamentals of Database Systems, 7th ed. Pearson, 2016
dc.relation.referencesComisión de Regulación de Comunicaciones (CRC), Resolución 5050 de 2016: Por la cual se compilan las disposiciones regulatorias aplicables a los servicios de telecomunicaciones, Bogotá, 2016
dc.relation.referencesComisión de Regulación de Comunicaciones (CRC), Resolución 6333 de 2021: Por la cual se modifica el Título de Reportes de Información, Bogotá, 2021.
dc.relation.referencesCongreso de la República de Colombia, Ley 1978 de 2019: Por la cual se moderniza el sector TIC, Diario Oficial No. 51.020, 25 de julio de 2019
dc.relation.referencesCongreso de la República de Colombia, Ley 1712 de 2014: Ley de Transparencia y del Derecho de Acceso a la Información Pública Nacional, Diario Oficial No. 49.084, 6 de marzo de 2014.
dc.relation.referencesMinisterio de Ciencia, Tecnología e Innovación (MinCiencias), “Convocatoria 908 de 2021 – Proyectos de I+D+i para el fortalecimiento del sector TIC y audiovisual,” Bogotá, 2021. [En línea]. Disponible en: https://minciencias.gov.co/convocatorias
dc.relation.referencesSong YY, Lu Y. Decision tree methods: applications for classification and prediction. Shanghai Arch Psychiatry. 2015;27(2):130–135. doi: 10.11919
dc.relation.referencesSalvador García, S., Luengo, J., & Herrera, F. (2016, octubre). Big Data: Preprocesamiento y calidad de datos. Departamento de Ciencias de la Computación e Inteligencia Artificial, Universidad de Granada (España).
dc.rights.accesoAbierto (Texto Completo)
dc.rights.accessrightsOpenAccess
dc.subjectSeries Temporales
dc.subjectPredicción de Suscriptores
dc.subjectTelecomunicaciones
dc.subjectMAPE
dc.subjectMAE
dc.subject.keywordTime Series
dc.subject.keywordSubscriber Prediction
dc.subject.keywordTelecommunications
dc.subject.keywordMAPE
dc.subject.keywordMAE
dc.subject.lembIngeniería en Telecomunicaciones -- Tesis y disertaciones académicas
dc.titleDesarrollo de un modelo basado en machine learning para pronosticar el número de usuarios de televisión por suscripción para el departamento de Cundinamarca
dc.title.titleenglishDevelopment of a machine learning-based model to forecast the number of subscription television users in the department of Cundinamarca
dc.typebachelorThesis
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.degreeMonografía
dc.type.driverinfo:eu-repo/semantics/bachelorThesis

Archivos

Bloque original

Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
Licencia de uso y publicacion.pdf
Tamaño:
247.16 KB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
GallegoValcarcelFabianAndres2025.pdf
Tamaño:
3.15 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: