Implementación de redes tipo transformer en la selección estratégica de perfiles laborales a nivel empresarial

Fecha

Autor corporativo

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Distrital Francisco José de Caldas

Compartir

Altmetric

Resumen

In this project, a RAG (Retrieval-Augmented Generation) model is developed for application in the context of recruitment and personnel selection (limited to areas related to Electronic Engineering). The starting point is the creation of a document database (composed of PDF files), followed by a preprocessing phase based on text cleaning and tokenization, which is then converted into a vectorized database. The data is prepared for model training through chunking and indexing operations, enabling the inclusion of a Large Language Model (LLM) based on a transformer model. This model, along with vector search mechanisms and similarity learning, allows for language generation and information retrieval, respectively. By integrating each of these components, the RAG model is constructed. The aim is to find the best parameters according to the given conditions, evaluating the performance obtained in each case to achieve the best result.

Descripción

En este proyecto se desarrolla la implementación de un modelo RAG (Retrieval aumented Generation), encaminado a su aplicación en el contexto del reclutamiento y la selección de personal (limitado a las áreas relacionadas a Ingeniería Electrónica), para ello se tiene como punto de partida la obtención de una base de datos documental (conformada por archivos tipo PDF), pasando por una fase de preprocesamiento basada en limpieza de texto y tokenizacion, para posteriormente convertirse en una base de datos vectorizada. Los datos son preparados para el entrenamiento del modelo mediante operaciones de chuking e indexing, permitiendo en consecuencia la inclusión de un LLM (Large Language Model) basado en un modelo transformer, el cual, junto a mecanismos de búsqueda vectorial y aprendizaje por similitud, permiten la generación de lenguaje y la recuperación de información respectivamente. Es así como al hacer un proceso de integración de cada una de las partes se conforma el RAG, con base a ello se pretende encontrar los mejores parámetros de acuerdo a las condiciones dadas, evaluando el rendimiento obtenido en cada caso, en busca del mejor resultado.

Palabras clave

LangChain, RAG, LlamaIndex, NLP, Inteligencia artificial

Materias

Ingeniería Electrónica -- Tesis y disertaciones académicas , Inteligencia computacional , Procesamiento de lenguaje natural , Redes transformer (Aprendizaje profundo) , Planificación de recursos humanos , Administración de personal

Citación