Riveros Solorzano, Hernán JavierPeña Reyes, Ana MaríaPérez León, Camila AndreaLópez González, Brayan Arnulfo2025-03-042025-03-042024-10-09http://hdl.handle.net/11349/93187Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este contexto, se ve necesario adoptar nuevas tecnologías en la labor del periodista; la inteligencia artificial resulta una herramienta de mucha utilidad. El presente proyecto se enfoca en desarrollar un conjunto de datos de noticias falsas escritas en español que puedan ser utilizados para entrenar un modelo de aprendizaje automático capaz de clasificar noticias de forma precisa. La creación de un conjunto de datos de noticias falsas en español es un desafío importante debido a la necesidad de garantizar la calidad y la representatividad de los datos que permitan entrenar un modelo efectivo. Para esto se contará con las bases propuestas por el periodismo de datos, siendo esta un área donde converge el conocimiento del periodista y las ciencias de datos.Fake news represents a problem that is increasingly difficult to manage. Social networks and constant exposure to information make the task of determining the difference between true and false news a task impossible for humans to perform. In this context, it is necessary to adopt new technologies in the journalist's work; Artificial intelligence is a very useful tool. This project focuses on developing a data set of fake news written in Spanish that can be used to train a machine learning model capable of accurately classifying news. Creating a fake news dataset in Spanish is a significant challenge due to the need to guarantee the quality and representativeness of the data that allows training an effective model. For this, the bases proposed by data journalism will be available, this being an area where the knowledge of the journalist and data sciences converge.pdfspaNoticias falsasPosverdadPeriodismo de datosConjunto de datosAprendizaje automáticoCiencia de datosCreación de un conjunto de datos para el entrenamiento de un modelo de aprendizaje automático capaz de detectar noticias falsas de Colombia escritas en español desde la perspectiva del periodismo de datosbachelorThesisComunicación Social y Periodismo -- Tesis y Disertaciones AcadémicasPeriodismo en líneaRedes sociales -- InvestigacionesNoticias falsas -- InvestigacionesOpenAccessCreation of a data set for training a machine learning model capable of detecting fake news from Colombia written in Spanish from the perspective of data journalismFake NewsData SetData SciencePost-truthMachine LearningData JournalismAbierto (Texto Completo)