Comparación del Funcionamiento del Algoritmo C4.5 en un Modelo de Persistencia Relacional Contra un Modelo no Relacional

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

In this document is show two differents implementations of C4.5 algorithm one of them using PostgreSql and PgPool as relational persistence model and on the other hand using Hadoop as non relational model, afterwards using a metric the two versions are compared.

Descripción

En este documento se muestran dos implementaciones del algoritmo C4.5 en un ambiente clusterizado, una utilizando como persistencia un modelo relacional usando PostgreSQL y PgPool, y otra basada en un modelo no relacional utilizando Hadoop; para posteriormente por medio de una métrica comparar sus rendimientos.

Palabras clave

Minería de Datos, Arboles de Decisión, Persistencia, C4.5, Hadoop, HDFS, PostgreSQL, Pgpool, Clúster

Citación