Comparación del Funcionamiento del Algoritmo C4.5 en un Modelo de Persistencia Relacional Contra un Modelo no Relacional
Fecha
Autores
Autor corporativo
Título de la revista
ISSN de la revista
Título del volumen
Editor
Compartir
Altmetric
Resumen
In this document is show two differents implementations of C4.5 algorithm one of them using PostgreSql and PgPool as relational persistence model and on the other hand using Hadoop as non relational model, afterwards using a metric the two versions are compared.
Descripción
En este documento se muestran dos implementaciones del algoritmo C4.5 en un ambiente clusterizado, una utilizando como persistencia un modelo relacional usando PostgreSQL y PgPool, y otra basada en un modelo no relacional utilizando Hadoop; para posteriormente por medio de una métrica comparar sus rendimientos.
Palabras clave
Minería de Datos, Arboles de Decisión, Persistencia, C4.5, Hadoop, HDFS, PostgreSQL, Pgpool, Clúster
