Bayesian methods for classification inappropriate web pages
Fecha
Autor corporativo
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Distrital Francisco José de Caldas
Compartir
Director
Altmetric
Resumen
Descripción
The incursion of the Internet has created new forms of information and communication, but it can also carry great dangers, when its use is related to inappropriate content, such as, access to harmful contents and the rise of new kinds of crimes. In this situation, automatic filtering systems identify improper Internet content. This paper describes the use of an algorithm, to automatically filter out inappropriate Web pages. To accomplish this (automatic filtering) task implementation method TAN (Tree Augmented Naive Bayes) is plasma. Data mining algorithms and computational learning for the extraction process, representation and classification of web pages are implemented.
La incursión de Internet ha creado nuevas formas de información y comunicación, pero también puede conllevar grandes peligros cuando su uso está relacionado con contenido inapropiado, como el acceso a contenidos dañinos y el surgimiento de nuevos tipos de crímenes. En esta situación, los sistemas de filtrado automático identifican contenido inapropiado de Internet. Este documento describe el uso de un algoritmo para filtrar automáticamente las páginas web inapropiadas. Para lograr este método de implementación de tareas (filtrado automático) TAN (Tree Augmented Naive Bayes) es plasma. Se implementan algoritmos de minería de datos y aprendizaje computacional para el proceso de extracción, representación y clasificación de páginas web.
La incursión de Internet ha creado nuevas formas de información y comunicación, pero también puede conllevar grandes peligros cuando su uso está relacionado con contenido inapropiado, como el acceso a contenidos dañinos y el surgimiento de nuevos tipos de crímenes. En esta situación, los sistemas de filtrado automático identifican contenido inapropiado de Internet. Este documento describe el uso de un algoritmo para filtrar automáticamente las páginas web inapropiadas. Para lograr este método de implementación de tareas (filtrado automático) TAN (Tree Augmented Naive Bayes) es plasma. Se implementan algoritmos de minería de datos y aprendizaje computacional para el proceso de extracción, representación y clasificación de páginas web.
Palabras clave
Bayesian methods, Data Preprocessing, Machine Learning, Web Content Filtering, Web Mining, métodos bayesianos, preprocesamiento de datos, aprendizaje automático, filtrado de contenido web, minería web