Análisis de herramientas y tendencias en procesamiento inteligente de documentos: Un enfoque de vigilancia tecnológica
| dc.contributor.advisor | Rodríguez Rojas, Luz Andrea | |
| dc.contributor.author | Venegas Clavijo, Mateo | |
| dc.contributor.author | Lopez Robayo, William Alexander | |
| dc.contributor.orcid | Rodríguez Rojas Luz Andrea [0000-0003-0312-1177] | |
| dc.date.accessioned | 2025-12-16T17:05:37Z | |
| dc.date.available | 2025-12-16T17:05:37Z | |
| dc.date.created | 2025-10-17 | |
| dc.description | En la era digital, la gestión documental se ha convertido en un desafío crítico para las organizaciones, debido al crecimiento exponencial de información estructurada y no estructurada. Este entorno ha impulsado la búsqueda de soluciones tecnológicas que mejoren la administración de documentos y datos. En este contexto, el Procesamiento Inteligente de Documentos (PID) representa una evolución significativa, al integrar tecnologías como la Inteligencia Artificial (IA), el Procesamiento de Lenguaje Natural (PLN), el Reconocimiento Óptico de Caracteres (OCR) y la Automatización Robótica de Procesos (RPA). Estas herramientas permiten automatizar tareas repetitivas, clasificar información, extraer datos clave y mejorar la precisión en la toma de decisiones, lo que se traduce en mayor productividad y reducción de costos operativos. El problema abordado en esta monografía radica en la necesidad de comprender cómo estas tecnologías están transformando la gestión documental, especialmente en contextos como el colombiano, donde persisten barreras técnicas, regulatorias y de adopción, especialmente en pequeñas y medianas empresas (pymes). El objetivo de esta monografía es realizar una vigilancia tecnológica sobre las herramientas de PID, analizando su evolución entre 2015 y 2025, con énfasis en las tendencias emergentes, sus aplicaciones sectoriales y los desafíos que enfrenta su implementación. La metodología empleada consistió en una revisión sistemática de literatura científica, patentes y reportes sectoriales, lo que permitió identificar casos de éxito en sectores como finanzas, salud y manufactura, donde se ha optimizado la gestión de facturas, contratos y registros mediante estas tecnologías. Entre las principales conclusiones, se evidencia que el PID ha evolucionado desde soluciones básicas de Reconocimiento Óptico de Caracteres hacia plataformas avanzadas con capacidades cognitivas, predictivas y adaptativas. El auge de arquitecturas modulares, modelos en la nube como Software como Servicio (SaaS) y Agente como Servicio (AaaS), así como tecnologías emergentes como la validación semántica, proyectan un crecimiento del mercado entre el 32 % y el 37 % anual hasta 2027. Finalmente, se proponen recomendaciones para una adopción estratégica del PID, haciendo énfasis en soluciones escalables, interoperables y centradas en el usuario, además de señalar líneas futuras de investigación en áreas como la gobernanza de datos y la integración con tecnologías disruptivas, como blockchain e inteligencia artificial generativa. | |
| dc.description.abstract | In the digital age, efficient document management has become a critical challenge for organizations due to the exponential growth of structured and unstructured information. This study conducts a technological surveillance of Intelligent Document Processing (IDP) tools, examining how technologies such as Artificial Intelligence (AI), Natural Language Processing (NLP), Optical Character Recognition (OCR), and Robotic Process Automation (RPA) are revolutionizing document management. These solutions automate repetitive tasks, classify information, extract key data, and improve decision-making accuracy, resulting in increased productivity and reduced operating costs. The analysis focuses on the evolution of IDP between 2015 and 2025, identifying key trends such as the integration of modular architectures, the rise of cloud-based models (SaaS and AaaS), and the development of advanced cognitive capabilities. Through a systematic review of scientific articles, patents, and industry reports, success stories are highlighted in sectors such as finance, healthcare, and manufacturing, where these technologies have optimized processes such as invoice management, contract analysis, and record digitization. However, persistent challenges are also highlighted, such as reliance on training data, organizational resistance to change, and limitations in adoption by small and medium-sized enterprises (SMEs). The findings demonstrate that the IDP has transitioned from basic OCR solutions to comprehensive platforms with predictive and adaptive capabilities. Emerging technologies, such as semantic validation and automation-on-demand services (AaaS), promise to further boost this market, projecting annual growth of 32% to 37% by 2027. However, their implementation in contexts such as Colombia's requires overcoming technical, regulatory, and training barriers. This paper concludes with recommendations for the strategic adoption of IDP, emphasizing the need for scalable, interoperable, and user-centric solutions, as well as future research directions in areas such as data governance and integration with disruptive technologies (blockchain, generative AI). | |
| dc.format.mimetype | ||
| dc.identifier.uri | http://hdl.handle.net/11349/100182 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Distrital Francisco José de Caldas | |
| dc.relation.references | Abdullah, M. R. Bin, & Iqbal, K. (2022). A review of intelligent document processing applications across diverse industries. Journal of Artificial Intelligence and Machine Learning in Management, 6(2), Https://journals.sagescience.org/index.php/jamm/article/view/106/88 | |
| dc.relation.references | Afzal, S., Rajmohan, C., Kesarwani, M., Mehta, S., & Patel, H. (2020). Data readiness report. Https://doi.org/10.48550/arxiv.2010.07213 | |
| dc.relation.references | Anagnoste, S. (2018). Robotic Automation Process – The Operating System for the Digital Enterprise. Proceedings of the 12th International Conference on Business Excellence, 12(1), 54–69. Https://doi.org/10.2478/picbe-2018-0007 | |
| dc.relation.references | Arias, H. P. P., & Ochoa, D. Y. J. (2015). Desarrollo de un sistema inteligente para la clasificación de documentos ya digitalizados aplicando redes neuronales supervisadas. Revista Tecnológica-ESPOL, Https://rte.espol.edu.ec/index.php/tecnologica/article/view/346 | |
| dc.relation.references | Ball, R., & Medeiros, N. (2012). Teaching integrity in empirical research: A protocol for documenting data management and analysis. The Journal of Economic Education, 43(2), 182–189. Https://www.jstor.org/stable/23248971 | |
| dc.relation.references | Carrillo Gómez, J. P. (2020). Propuesta de un modelo de vigilancia tecnológica para el Ejército de Colombia [Trabajo de grado, Universidad Militar Nueva Granada]. Universidad Militar Nueva Granada. Https://repository.umng.edu.co/server/api/core/bitstreams/8315f9b3-1297-4454-b003 a13a7cab2555/content | |
| dc.relation.references | Chen, Y., Xu, L., Wang, C., & Liu, W. (2019). Layoutlm: Pre-training of Text and Layout for Document Image Understanding. Https://arxiv.org/pdf/1912.13318 | |
| dc.relation.references | Covarrubias López, P. A. (2020). Implementación del proceso de vigilancia tecnológica en una pyme [Trabajo recepcional de maestría, Instituto Tecnológico y de Estudios Superiores de Occidente]. Instituto Tecnológico y de Estudios Superiores de Occidente. Https://rei.iteso.mx/server/api/core/bitstreams/483f97a6-6f44-4d42-9d89 44b5bc70ae0f/content | |
| dc.relation.references | Cuevas, I. O. Comparativa de servicios OCR para documentos administrativos en PDF con Java/Tess4J y Python/easyocr. Cuadernos Técnicos Universitarios de la DGTIC, 2(1). Https://cuadernos.tic.unam.mx/index.php/cua/article/view/37 | |
| dc.relation.references | Cutting, G. A., & Cutting-Decelle, A. F. (2021). Intelligent document processing— Methods and tools in the real world. Arxiv preprint arxiv:2112.14070. Https://arxiv.org/pdf/2112.14070 | |
| dc.relation.references | Ehrlinger, L., & Wöß, W. (2022). A survey of data quality measurement and monitoring tools. Frontiers in Big Data, 5, 850611. Https://arxiv.org/abs/1907.08138 | |
| dc.relation.references | Evans, M. & Blohm, N. (2023). Intelligent Document Processing Assitant. [Patent no. US 2024/0303412 A1]. Ricoh Company. | |
| dc.relation.references | Everest Group. (2023). PID State of the Market Report 2023. Everest Group https://www2.everestgrp.com/reportaction/EGR-2023-38-R-6033/Marketing | |
| dc.relation.references | Festa et al. (2019). Automation As a Service. [Patent no. US 2019/0220305 A1]. Jpmorgan Chase Bank | |
| dc.relation.references | Gelbukh, A. (2010). Procesamiento de lenguaje natural y sus aplicaciones. Komputer Sapiens, 1, 6-11. Https://d1wqtxts1xzle7.cloudfront.net/30768432/Procesamiento_de_lenguaje_natural_y_ sus_aplicaciones-libre.pdf | |
| dc.relation.references | Globe News Wire. (2023). Intelligent Document Processing Global Market Report Https://www.globenewswire.com/news release/2023/06/01/2680588/0/en/Intelligent-Document-Processing-Global-Market Report-2023.html | |
| dc.relation.references | Janasz, T., Mortensen, P., Reisswig, C., Weller, T., Herrmann, M., Crnoja, I., & Höhne, J. (2021). Advancements in ML-enabled intelligent document processing and how to overcome adoption challenges in enterprises. Die Unternehmung, 75(3), 340–355. Https://doi.org/10.5771/0042-059X-2021-3-340 | |
| dc.relation.references | Kolandaisamy, R., Rajagopal, H., Kolandaisamy, I., & Sinnappan, G. S. (2024). The Smart Document Processing with Artificial Intelligence. Proceedings of the 2024 International Conference on Artificial Life and Robotics (ICAROB2024), Japan. | |
| dc.relation.references | Lievano-Martínez, F. A., Fernández-Ledesma, J. D., Burgos, D., Branch-Bedoya, J. W., & Jimenez-Builes, J. A. (2022). Intelligent Process Automation: An Application in Manufacturing Industry. Sustainability, 14(8804). Https://doi.org/10.3390/su14148804 | |
| dc.relation.references | Lucintel. (2023). Intelligent Document Processing Market Report. Https://www.lucintel.com/intelligent-document-processing-market.aspx | |
| dc.relation.references | Lukkala, S. & Viiliaien, P. (2016). Document Automation. [Patent no. EP 34443466 B1]. European Patent Office. | |
| dc.relation.references | Markets and Markets (2023) Intelligent Document Processing Market. Https://www.marketsandmarkets.com/pressreleases/intelligent-document-processing.asp | |
| dc.relation.references | Mazo, A. P., & Quintero, D. M. (2022). Evaluación de la calidad de la información en las organizaciones, a través de herramientas tecnológicas. SIGNOS-Investigación en Sistemas de Gestión, 14(2). Https://doi.org/10.15332/24631140.7785 | |
| dc.relation.references | Moya-Espinosa, P. I., & Moscoso-Durán, F. F. (2017). Vigilancia tecnológica e inteligencia competitiva en el modelo empresarial del sector hotelero colombiano. Revista de Investigación, Desarrollo e Innovación, 8(1) 11-22. Https://doi.org/10.19053/20278306.v8.n1.2017.7367 | |
| dc.relation.references | Nahamoo et al. (2020) Intelligent Document System. [Patent no. US 11,797,583 B2]. Pryon Incorporated. | |
| dc.relation.references | Pandey, M., Arora, M., Arora, S., Goyal, C., Gera, V. K., & Yadav, H. (2023). AI based integrated approach for the development of intelligent document management system (IDMS). Procedia Computer Science, 230, 106361. Https://doi.org/10.1016/j.procs.2023.12.127 | |
| dc.relation.references | Perlick et al. (2018) Systems and Methods for Document Automation. [Patent no. US 2020/037116 A1]. Lyconos, inc. | |
| dc.relation.references | Piedrahita Mazo, A., & Montoya Quintero, D. (2022). Evaluación de la calidad de la información en las organizaciones, a través de herramientas tecnológicas. SIGNOS, Investigación en Sistemas Https://www.researchgate.net/publication/364944029 | |
| dc.relation.references | Planas, M., Rodríguez, T., & Lecha, M. (2004). La importancia de los datos. Nutrición Hospitalaria, 19(1), 11-13. Recuperado en 22 de enero de 2025, de http://scielo.isciii.es/scielo.php?Script=sci_arttext&pid=S0212 16112004000100003&lng=es&tlng=es | |
| dc.relation.references | Porto, G., Gutierrez, J., & Arboleda, J. (2022). Procesamiento inteligente de textos. Https://www.researchgate.net/profile/Geoffrey Porto/publication/360503298_Procesamiento_Inteligente_de_Textos/links/627aa414973b bb29cc722b11/Procesamiento-Inteligente-de-Textos.pdf | |
| dc.relation.references | Pushkarna, M., Zaldivar, A., & Kjartansson, O. (2022). Data cards: Purposeful and transparent dataset documentation for responsible AI. Arxiv. Https://doi.org/10.48550/arxiv.2204.01075 | |
| dc.relation.references | Rane, N., & Karthik, K. (2022). Building a platform for intelligent document processing: Opportunities and challenges. International Journal of Advanced Computer Science and Applications. | |
| dc.relation.references | Rodríguez-Cruz, Y., Castellanos-Crespo, A., & Ramírez-Peña, Z. (2015). Gestión documental, de información, del conocimiento e inteligencia organizacional: Particularidades y convergencia para la toma de decisiones estratégicas. Revista Cubana De Información En Ciencias De La Salud Https://acimed.sld.cu/index.php/acimed/article/view/870/577 | |
| dc.relation.references | Rodriguez Rogel, J. I., Herrera Egas, J. J., & Chala Cuadros, J. C. (2024). Análisis de la gestión documental y su impacto en los proyectos de vinculación del Instituto Tsa’chila, Santo Domingo, 2023. Revista Social Fronteriza, 4(1), e41173. Https://doi.org/10.59814/resofro.2024.4(1)173 | |
| dc.relation.references | Rohaime, M., Putra, R. Y. N., Rizkya, A., & Wulandari, N. (2022). Integrated Invoicing Solution: A Robotic Process Automation with AI and OCR Approach. WJARR, 2021(63), 1–6. | |
| dc.relation.references | Sanchez, P. H. A., Gomez, G. A. U., Tintinago, A. E., & Muñoz, Y. (2018). Etiquetado asistido de documentos de investigación mediante procesamiento de lenguaje natural y tecnologías de la web semántica. Scientia et Technica, 23(4), 528-537. Https://revistas.utp.edu.co/index.php/revistaciencia/article/view/17721 | |
| dc.relation.references | Sawadogo, P., Kibata, T., & Darmont, J. (2019). Metadata management for textual documents in data lakes. Arxiv preprint arxiv:1905.04037 Https://arxiv.org/abs/1905.04037 | |
| dc.relation.references | Sarker, I. H. (2021). Data science and analytics: An overview from data-driven smart computing, decision-making and applications perspective. SN Computer Science, 2(5), 377. Https://doi.org/10.1007/s42979-021-00765-8 | |
| dc.relation.references | Subrahmaniam et al. (2022) Intelligent Document Processing. [US 2024/0029175 A1]. Intuit, inc. | |
| dc.relation.references | Tiwari, M., Aital, P., & Joshi, P. (2024). A comprehensive survey and review of machine learning techniques in document processing: Industry applications and future directions. Journal of Information & Optimization Sciences, 45(4), 1177–1188. Https://doi.org/10.47974/JIOS-1701 | |
| dc.relation.references | Vignesh, B., & Krithika, J. (2022). An Overview on PID and Its Significance in Business. International Journal for Research in Applied Science & Engineering Technology (IJRASET), 10(10), 381–386. Https://doi.org/10.22214/ijraset.2022.47001 | |
| dc.relation.references | Visalli, F., Patrizio, A., Lanza, A., Papaleo, P., Nautiyal, A., Pupo, M., Scilinguo, U., Oro, E., & Ruffolo, M. (2023). Building a Platform for Intelligent Document Processing: Opportunities and Challenges. Ital-IA 2023: 3rd National Conference on Artificial Intelligence, Pisa, Italy. CEUR Workshop Proceedings. | |
| dc.relation.references | Yang, X., Liang, W., & Zou, J. (2024). Navigating dataset documentations in AI: A large-scale analysis of dataset cards on Hugging Face. Arxiv. Https://arxiv.org/abs/2401.13822v1 | |
| dc.rights.acceso | Abierto (Texto Completo) | |
| dc.rights.accessrights | OpenAccess | |
| dc.subject | Procesamiento inteligente de documentos (PID) | |
| dc.subject | Automatización | |
| dc.subject | Inteligencia artificial | |
| dc.subject | Gestión documental | |
| dc.subject | Vigilancia tecnológica | |
| dc.subject.keyword | Intelligent document processing (IDP) | |
| dc.subject.keyword | Automation | |
| dc.subject.keyword | Artificial intelligence | |
| dc.subject.keyword | Document management | |
| dc.subject.keyword | Technology watch | |
| dc.subject.lemb | Ingeniería Indistrial -- Tesis y disertaciones académicas | |
| dc.title | Análisis de herramientas y tendencias en procesamiento inteligente de documentos: Un enfoque de vigilancia tecnológica | |
| dc.title.titleenglish | Analysis of tools and trends in intelligent document processing: A technological surveillance approach | |
| dc.type | bachelorThesis | |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.degree | Monografía | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis |
Archivos
Bloque original
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 7 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
