Incrustaciones contextualizadas de palabras con ELMO

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

Natural language processing (NLP) is an essential and evolving field within machine learning, with applications such as machine translation, chatbots, sentiment analysis and plagiarism detection. Machine learning models for NLP seek efficient representations of words using different encodings, most notably word embeddings, which provide a simplified vector representation. However, these traditional models often omit the context of words. In this sense, ELMo (Embeddings from Language Models), a model that considers the context to generate dynamic vector representations, has emerged. ELMo employs a bidirectional language model (biLM), based on neural networks such as CNN , LSTM , and High-Way Network , allowing to capture context and solve polysemy problems. Introduced in 2018 by researchers at the Allen NLP Institute and the University of Washington, ELMo represents a significant advance in the field.

Descripción

El procesamiento del lenguaje natural (NLP, por sus siglas en inglés) es un campo esencial y en constante evolución dentro del aprendizaje automático, con aplicaciones como la traducción automática, chatbots, análisis de sentimientos y detección de plagio. Los modelos de aprendizaje automático para NLP buscan representaciones eficientes de palabras mediante distintas codificaciones, destacando las incrustaciones de palabras, que ofrecen una representación vectorial simplificada. Sin embargo, estos modelos tradicionales suelen omitir el contexto de las palabras. En este sentido, surge ELMo (Embeddings from Language Models), un modelo que considera el contexto para generar representaciones vectoriales dinámicas. ELMo emplea un modelo bidireccional de lenguaje (biLM), basado en redes neuronales como CNN, LSTM, y High-Way Network, permitiendo capturar el contexto y resolver problemas de polisemia. Presentado en 2018 por investigadores del Instituto Allen NLP y la Universidad de Washington, ELMo representa un avance significativo en el campo.

Palabras clave

CNN, LSTM, Highway network, BiLM, Polisemia, NLP

Materias

Matemáticas -- Tesis y disertaciones académicas , Aprendizaje automático (Inteligencia artificial) -- Aplicaciones , Métodos de simulación , Polisemia -- Matemáticas , Procesamiento del lenguaje natural , Redes neuronales recurrentes bidireccionales

Citación

Colecciones