Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas
| dc.contributor.advisor | Gaona Barrera, Andres Eduardo | |
| dc.contributor.author | Camacho Velasquez, Sergio Andres | |
| dc.date.accessioned | 2023-05-09T17:54:20Z | |
| dc.date.available | 2023-05-09T17:54:20Z | |
| dc.date.created | 2022-09-02 | |
| dc.description | Este documento propone modelos basados en CNN y RNN-LSTM para la identificación de errores frecuentes del idioma español en estudiantes anglófonos y francófonos oriundos de Estados Unidos y Canadá. Las experimentaciones realizadas muestran una exactitud media de 88%, destacando desempeños superiores al 90% en las palabras bien pronunciadas, y superiores al 70% en la identificación de errores de pronunciación. Se implementan técnicas de Aumento de Datos, Regularización L2 y Dropout para prevenir sobreajuste de los parámetros durante el entrenamiento con la base de datos construida. Adicionalmente, se implementa Normalización por Capa, Normalización por Batch y técnicas de Data Pipeline para reducir los tiempos de entrenamiento por experimento. | spa |
| dc.description.abstract | This document presents models based on CNN and RNN-LSTM for Spanish mispronunciation detection in Anglophone and Francophone students from the United States and Canada. The results of the experimentations show an average accuracy of 88%, highlighting performances above 90% in well-pronounced words and above 70% in identifying mispronunciations. The models implement Data Augmentation, L2 Regularization, and Dropout techniques to prevent overfitting during training with the built database. Also, they implement Layer Normalization, Batch Normalization, and Data Pipeline techniques to reduce training times per experiment. | spa |
| dc.format.mimetype | spa | |
| dc.identifier.uri | http://hdl.handle.net/11349/31293 | |
| dc.language.iso | spa | spa |
| dc.rights | Atribución-NoComercial 4.0 Internacional | * |
| dc.rights.acceso | Abierto (Texto Completo) | spa |
| dc.rights.accessrights | OpenAccess | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0/ | * |
| dc.subject | CNN | spa |
| dc.subject | RNN-LSTM | spa |
| dc.subject | LSTM | spa |
| dc.subject | Aumento de datos | spa |
| dc.subject | Mala pronunciación en español | spa |
| dc.subject.keyword | CNN | spa |
| dc.subject.keyword | RNN-LSTM | spa |
| dc.subject.keyword | LSTM | spa |
| dc.subject.keyword | Data Augmentation | spa |
| dc.subject.keyword | Spanish Mispronunciation | spa |
| dc.subject.lemb | Ingeniería Electrónica - Tesis y disertaciones académicas | spa |
| dc.subject.lemb | Neuronas | spa |
| dc.subject.lemb | Red nerviosa | spa |
| dc.subject.lemb | Español - Pronunciación | spa |
| dc.title | Identificación de errores frecuentes en la pronunciación del español en hablantes no nativos utilizando redes neuronales profundas | spa |
| dc.title.titleenglish | Spanish mispronunciation detection using deep neural networks for non-native learners | spa |
| dc.type | bachelorThesis | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | spa |
| dc.type.degree | Monografía | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | spa |
Archivos
Bloque original
1 - 2 de 2
Cargando...
- Nombre:
- TesisSergioCamacho.pdf
- Tamaño:
- 5 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Trabajo de grado
No hay miniatura disponible
- Nombre:
- Licencia de uso y publicacion.pdf
- Tamaño:
- 258.18 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Licencia de uso y publicacion
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 7 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
