Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas

dc.contributor.advisorGaona Barrera, Andres Eduardo
dc.contributor.authorCamacho Velasquez, Sergio Andres
dc.date.accessioned2023-05-09T17:54:20Z
dc.date.available2023-05-09T17:54:20Z
dc.date.created2022-09-02
dc.descriptionEste documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento.spa
dc.description.abstractThis document presents models based on CNN and RNN-LSTM for Spanish mispronunciation detection in Anglophone and Francophone students from the United States and Canada. The results of the experimentations show an average accuracy of 88%, highlighting performances above 90% in well-pronounced words and above 70% in identifying mispronunciations. The models implement Data Augmentation, L2 Regularization, and Dropout techniques to prevent overfitting during training with the built database. Also, they implement Layer Normalization, Batch Normalization, and Data Pipeline techniques to reduce training times per experiment.spa
dc.format.mimetypepdfspa
dc.identifier.urihttp://hdl.handle.net/11349/31293
dc.language.isospaspa
dc.rightsAtribución-NoComercial 4.0 Internacional*
dc.rights.accesoAbierto (Texto Completo)spa
dc.rights.accessrightsOpenAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/*
dc.subjectCNNspa
dc.subjectRNN-LSTMspa
dc.subjectLSTMspa
dc.subjectAumento de datosspa
dc.subjectMala pronunciación en españolspa
dc.subject.keywordCNNspa
dc.subject.keywordRNN-LSTMspa
dc.subject.keywordLSTMspa
dc.subject.keywordData Augmentationspa
dc.subject.keywordSpanish Mispronunciationspa
dc.subject.lembIngeniería Electrónica - Tesis y disertaciones académicasspa
dc.subject.lembNeuronasspa
dc.subject.lembRed nerviosaspa
dc.subject.lembEspañol - Pronunciaciónspa
dc.titleIdentificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundasspa
dc.title.titleenglishSpanish mispronunciation detection using deep neural networks for non-native learnersspa
dc.typebachelorThesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.degreeMonografíaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
TesisSergioCamacho.pdf
Tamaño:
5 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de grado
No hay miniatura disponible
Nombre:
Licencia de uso y publicacion.pdf
Tamaño:
258.18 KB
Formato:
Adobe Portable Document Format
Descripción:
Licencia de uso y publicacion

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: