Muñoz Quiñonez, Gerardo AlcidesGutiérrez García, Luis FernandoPenagos Rodriguez, Daniel Felipe2023-07-182023-07-182022-10-06http://hdl.handle.net/11349/31845Este documento describe el proyecto de pasantía realizado en Inversiones Gutiérrez García, que es una empresa que se centra en el desarrollo de herramientas basadas en inteligencia artificial, como la visión por computadora y el procesamiento del lenguaje natural (NLP). Una gran porción de sus clientes son estaciones de servicios (EDS). Estas necesitan aplicaciones de NLP que les permitan conocer de manera recursiva y automatizada la percepción de los clientes hacia su servicio y su posicionamiento como empresa frente a los competidores. Debido a las necesidades anteriormente descritas, se procede a desarrollar modelos que tengan como propósito la clasificación de la polaridad de comentarios y la identificación de temas, específicamente en textos en idioma español y en con un “lenguaje” particular y específico, como el usado en el contexto de las estaciones de servicio. Se logró entrenar dos modelos para distintas tareas, el primero es el modelo de análisis de sentimiento que permite clasificar documentos según la polaridad del comentario (negativa, neutra y positiva). El segundo es el modelo de reconocimiento de entidades nombradas (NER), el cual detecta automáticamente entidades importantes, lo que permite estructurar la información. Además de los modelos entrenados, se usaron los modelos BERTopic y KeyBert para la extracción de temas en un conjunto de documentos y la extracción de palabras clave en un documento. Finalmente se proponen seis aplicaciones para la navegación de los datos obtenidos y la utilización sencilla de los modelos. Cuatro de estas aplicaciones permiten usar de manera intuitiva y sencilla los cuatro modelos implementados en el proyecto (Análisis de sentimientos, modelo NER, BERTopic y KeyBERT). La quinta aplicación permite navegar geográficamente por estaciones de servicios y sus comentarios asociados, lo cual genera una percepción del posicionamiento de la EDS frente a la competencia. La sexta aplicación permite visualizar los embeddings de comentarios en 2 dimensiones, lo cual es clave para el entendimiento de la clasificación y separación de temas por documentos.This document describes the internship project carried out at Inversiones Gutiérrez García, is a company that focuses on developing tools based on artificial intelligence, such as computer vision and natural language processing (NLP). A large portion of its customers are service stations (EDS). They need NLP applications that allow them to know in a recursive and automated way the perception of customers towards their service and their positioning as a company compared to competitors. Due to the needs described above, we proceed to develop models whose purpose is the classification of the polarity of comments and the identification of themes, specifically in texts in Spanish and in a particular and specific "language", such as the one used in the context of service stations. It was possible to train two models for different tasks, the first is the sentiment analysis model that allows classifying documents according to the polarity of the comment (negative, neutral and positive). The second is the Named Entity Recognition (NER) model, which automatically detects important entities, allowing information to be structured. In addition to the trained models, the BERTopic and KeyBert models were used for topic extraction in a set of documents and keyword extraction in a document. Finally, six applications are proposed for browsing the data obtained and the simple use of the models. Four of these applications allow the four models implemented in the project to be used intuitively and easily (Sentiment Analysis, NER model, BERTopic and KeyBERT). The fifth application allows you to navigate geographically by service stations and their associated comments, which generates a perception of the positioning of the EDS against the competition. The sixth application allows viewing comment embeddings in 2 dimensions, which is key to understanding the classification and separation of topics by documents.pdfspaAttribution-NonCommercial-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Inteligencia artificialAnálisis de sentimientosModelado de temasProcesamiento del lenguaje naturalAprendizaje automáticoModelado de temas y análisis de sentimientos utilizando inteligencia artificialbachelorThesisIngeniería Electrónica -- Tesis y disertaciones académicasInteligencia artificial en servicios de estaciones de servicio (EDS)Análisis de sentimiento en textos en españolReconocimiento de entidades nombradas (NER)Modelos BERTopic y KeyBERTOpenAccessTopic modeling and sentiment analysis using artificial intelligenceArtificial intelligenceSentiment analysisTheme modelingNatural language processingMachine learningAbierto (Texto Completo)