Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas
Date
2022-09-02Author
Camacho Velasquez, Sergio Andres
Director
Gaona Barrera, Andres Eduardo
Palabras clave
CNN, RNN-LSTM, LSTM, Aumento de datos, Mala pronunciación en españolMaterias
Ingeniería Electrónica - Tesis y disertaciones académicas, Neuronas, Red nerviosa, Español - PronunciaciónTipo de publicación
Trabajo de grado Pregrado / TesisCitación
Metadata
Show full item recordDocuments PDF
Abstract
Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento.
Abstract
This document presents models based on CNN and RNN-LSTM for Spanish mispronunciation detection in Anglophone and Francophone students from the United States and Canada. The results of the experimentations show an average accuracy of 88%, highlighting performances above 90% in well-pronounced words and above 70% in identifying mispronunciations. The models implement Data Augmentation, L2 Regularization, and Dropout techniques to prevent overfitting during training with the built database. Also, they implement Layer Normalization, Batch Normalization, and Data Pipeline techniques to reduce training times per experiment.
Collections
- Ingeniería Electrónica [496]
The following license files are associated with this item: