Modelo de procesamiento paralelo en arquitecturas heterogéneas para regresiones lineales multivariables

dc.contributor.advisorVera Parra, Nelson Enriquespa
dc.contributor.authorRojas Quintero, Cristian Alejandrospa
dc.date.accessioned2019-06-20T21:46:56Z
dc.date.available2019-06-20T21:46:56Z
dc.date.created2019-03-01spa
dc.descriptionLa generación de modelos de regresión lineal múltiple demanda una selección exhaustiva de las variables regresoras que permiten obtener un alto nivel de precisión en las tareas de predicción. Este proceso de selección representa un alto reto algorítmico y computacional, debido a que es necesario obtener y evaluar cada uno de los posibles modelos para poder seleccionar de forma eficiente el más preciso. En este trabajo se creó un modelo de procesamiento paralelo para parametrizar modelos de regresiones lineales multivariables, utilizando arquitecturas heterogéneas: HMMMR (Heterogeneous Model for Massive Multilinear Regressions). HMMMR fue diseñado orientado a explotar los benefi cios de las capacidades de computo paralelo de GPUs mediante el uso de estructuras de datos y operaciones matriciales optimizadas para realizar cálculos en batch. El objetivo principal de HMMMR es hacer una selección de un subconjunto de predictores que presenten mejores resultados en una regresión lineal para una determinada variable objetivo. La implementación de HMMMR muestra superioridad en el tiempo de cálculo de regresiones dado que se hace un uso mas e ficiente de las capacidad de procesamiento en batch de la GPU. Para los datasets evaluados (29332215 y 46626033 regresiones con datos niveles y precipitaciones de embalses ubicados en Colombia) la implementación de HMMMR llegó a ser hasta 9.8 y 5.06 veces más rápida que la implementación en una plataforma homogénea. Disponibilidad: https://github.com/carojasq/HMMMR .spa
dc.description.abstractThe generation of multiple linear regression models demands an exhaustive selection of the return variables that allow obtaining a high level of precision in the prediction tasks. This selection process represents a high algorithmic and computational challenge, due to the fact that it is necessary to obtain and evaluate each of the possible models in order to efficiently select the most accurate one. In this work, a parallel processing model was created to parameterize multivariable linear regression models, using heterogeneous architectures: HMMMR (Heterogeneous Model for Massive Multilinear Regressions). HMMMR was designed to exploit the benefits of parallel computing capabilities of GPUs through the use of data structures and optimized matrix operations to perform batch calculations. The main objective of HMMMR is to make a selection of a subset of predictors that present better results in a linear regression for a given target variable. The implementation of HMMMR shows superiority in the regression calculation time since a more efficient use of the batch processing capacity of the GPU is made. For the datasets evaluated (29332215 and 46626033 regressions with data levels and precipitations of reservoirs located in Colombia) the implementation of HMMMR was up to 9.8 and 5.06 times faster than the implementation in a homogeneous platform. Availability: https://github.com/carojasq/HMMMR.spa
dc.format.mimetypepdfspa
dc.identifier.urihttp://hdl.handle.net/11349/15364
dc.language.isospaspa
dc.rightsAtribución-NoComercial-SinDerivadas 4.0 Internacional*
dc.rights.accesoAbierto (Texto Completo)spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectGPUspa
dc.subjectCiencia de datosspa
dc.subjectComputación heterogéneaspa
dc.subjectRegresiones lineales multivariablesspa
dc.subject.keywordGPUspa
dc.subject.keywordData sciencespa
dc.subject.keywordHeterogeneous computingspa
dc.subject.keywordMultivariable linear regresssionsspa
dc.subject.lembMaestría en Ciencias de la Información y las Comunicaciones - Tesis y disertaciones académicasspa
dc.subject.lembProcesamiento de datosspa
dc.subject.lembProgramación paralela (Computadores electrónicos)spa
dc.subject.lembAlgoritmosspa
dc.titleModelo de procesamiento paralelo en arquitecturas heterogéneas para regresiones lineales multivariablesspa
dc.title.titleenglishHeterogeneous architectures parallel model for massive multilinear regressionsspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.degreeInvestigación-Innovaciónspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
RojasQuinteroCristianAlejadnro2019.pdf
Tamaño:
2.2 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
RojasQuinteroCristianAlejadnro2019Anexos.zip
Tamaño:
429.73 KB
Formato:
Unknown data format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: