Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas

Camacho Velasquez, Sergio Andres

Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas

dc.contributor.advisor	Gaona Barrera, Andres Eduardo
dc.contributor.author	Camacho Velasquez, Sergio Andres
dc.date.accessioned	2023-05-09T17:54:20Z
dc.date.available	2023-05-09T17:54:20Z
dc.date.created	2022-09-02
dc.description	Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento.	spa
dc.description.abstract	This document presents models based on CNN and RNN-LSTM for Spanish mispronunciation detection in Anglophone and Francophone students from the United States and Canada. The results of the experimentations show an average accuracy of 88%, highlighting performances above 90% in well-pronounced words and above 70% in identifying mispronunciations. The models implement Data Augmentation, L2 Regularization, and Dropout techniques to prevent overfitting during training with the built database. Also, they implement Layer Normalization, Batch Normalization, and Data Pipeline techniques to reduce training times per experiment.	spa
dc.format.mimetype	pdf	spa
dc.identifier.uri	http://hdl.handle.net/11349/31293
dc.language.iso	spa	spa
dc.rights	Atribución-NoComercial 4.0 Internacional	*
dc.rights.acceso	Abierto (Texto Completo)	spa
dc.rights.accessrights	OpenAccess	spa
dc.rights.uri	http://creativecommons.org/licenses/by-nc/4.0/	*
dc.subject	CNN	spa
dc.subject	RNN-LSTM	spa
dc.subject	LSTM	spa
dc.subject	Aumento de datos	spa
dc.subject	Mala pronunciación en español	spa
dc.subject.keyword	CNN	spa
dc.subject.keyword	RNN-LSTM	spa
dc.subject.keyword	LSTM	spa
dc.subject.keyword	Data Augmentation	spa
dc.subject.keyword	Spanish Mispronunciation	spa
dc.subject.lemb	Ingeniería Electrónica - Tesis y disertaciones académicas	spa
dc.subject.lemb	Neuronas	spa
dc.subject.lemb	Red nerviosa	spa
dc.subject.lemb	Español - Pronunciación	spa
dc.title	Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas	spa
dc.title.titleenglish	Spanish mispronunciation detection using deep neural networks for non-native learners	spa
dc.type	bachelorThesis	spa
dc.type.coar	http://purl.org/coar/resource_type/c_7a1f	spa
dc.type.degree	Monografía	spa
dc.type.driver	info:eu-repo/semantics/bachelorThesis	spa