Creación de un conjunto de datos para el entrenamiento de un modelo de aprendizaje automático capaz de detectar noticias falsas de Colombia escritas en español desde la perspectiva del periodismo de datos

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

Fake news represents a problem that is increasingly difficult to manage. Social networks and constant exposure to information make the task of determining the difference between true and false news a task impossible for humans to perform. In this context, it is necessary to adopt new technologies in the journalist's work; Artificial intelligence is a very useful tool.

This project focuses on developing a data set of fake news written in Spanish that can be used to train a machine learning model capable of accurately classifying news. Creating a fake news dataset in Spanish is a significant challenge due to the need to guarantee the quality and representativeness of the data that allows training an effective model. For this, the bases proposed by data journalism will be available, this being an area where the knowledge of the journalist and data sciences converge.

Descripción

Las noticias falsas,representan una problemática cada vez más difícil de manejar. Las redes sociales y la constante exposición a la información, hacen que la labor de determinar la diferencia entre las noticias verdaderas y las falsas, sea una labor imposible de realizar para el ser humano. En este contexto, se ve necesario adoptar nuevas tecnologías en la labor del periodista; la inteligencia artificial resulta una herramienta de mucha utilidad. El presente proyecto se enfoca en desarrollar un conjunto de datos de noticias falsas escritas en español que puedan ser utilizados para entrenar un modelo de aprendizaje automático capaz de clasificar noticias de forma precisa. La creación de un conjunto de datos de noticias falsas en español es un desafío importante debido a la necesidad de garantizar la calidad y la representatividad de los datos que permitan entrenar un modelo efectivo. Para esto se contará con las bases propuestas por el periodismo de datos, siendo esta un área donde converge el conocimiento del periodista y las ciencias de datos.

Palabras clave

Noticias falsas, Posverdad, Periodismo de datos, Conjunto de datos, Aprendizaje automático, Ciencia de datos

Materias

Comunicación Social y Periodismo -- Tesis y Disertaciones Académicas , Periodismo en línea , Redes sociales -- Investigaciones , Noticias falsas -- Investigaciones

Citación