Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Compartir

Altmetric

Resumen

This document presents models based on CNN and RNN-LSTM for Spanish mispronunciation detection in Anglophone and Francophone students from the United States and Canada. The results of the experimentations show an average accuracy of 88%, highlighting performances above 90% in well-pronounced words and above 70% in identifying mispronunciations. The models implement Data Augmentation, L2 Regularization, and Dropout techniques to prevent overfitting during training with the built database. Also, they implement Layer Normalization, Batch Normalization, and Data Pipeline techniques to reduce training times per experiment.

Descripción

Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento.

Palabras clave

CNN, RNN-LSTM, LSTM, Aumento de datos, Mala pronunciación en español

Materias

Ingeniería Electrónica - Tesis y disertaciones académicas , Neuronas , Red nerviosa , Español - Pronunciación

Citación