Prototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosql
| dc.contributor.advisor | Ordoñez Salinas, Sonia del Carmen | spa |
| dc.contributor.author | Parra Baquero, Andrea Nathaly | spa |
| dc.contributor.author | Robles Morales, Edison Armando | spa |
| dc.date.accessioned | 2017-12-20T17:07:02Z | |
| dc.date.available | 2017-12-20T17:07:02Z | |
| dc.date.created | 2017-11-21 | spa |
| dc.description | En este trabajo se presenta el desarrollo de una herramienta de extracción de información para documentos PDF, cuyo funcionamiento se basa en la combinación de técnicas de rastreo de información, reconocimiento óptico de caracteres y patrones de extracción de información. El principal objetivo es permitir la búsqueda de entidades nombradas en documentos PDF que se encuentran alojados en un dominio específico. | spa |
| dc.description.abstract | This paper presents the development of an information extraction tool for PDF documents, whose operation is based on the combination of information tracking techniques, optical character recognition and information extraction patterns. The main objective is allow the search of named entities in PDF documents that are hosted in a specific domain. | spa |
| dc.format.mimetype | spa | |
| dc.identifier.uri | http://hdl.handle.net/11349/7308 | |
| dc.language.iso | spa | spa |
| dc.rights | Atribución-NoComercial-SinDerivadas 4.0 Internacional | * |
| dc.rights.acceso | Restringido (Solo Referencia) | spa |
| dc.rights.accessrights | info:eu-repo/semantics/restrictedAccess | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject | OCR | spa |
| dc.subject | Crawler | spa |
| dc.subject | NLTK | spa |
| dc.subject | Extracción | spa |
| dc.subject.keyword | OCR | spa |
| dc.subject.keyword | Crawler | spa |
| dc.subject.keyword | NLTK | spa |
| dc.subject.keyword | Extract | spa |
| dc.subject.lemb | INGENIERÍA DE SISTEMAS - TESIS Y DISERTACIONES ACADÉMICAS | spa |
| dc.subject.lemb | RECUPERACIÓN DE INFORMACIÓN - PROGRAMAS PARA COMPUTADOR | spa |
| dc.subject.lemb | DESARROLLO DE PROGRAMAS PARA COMPUTADOR | spa |
| dc.subject.lemb | LINGÜÍSTICA COMPUTACIONAL | spa |
| dc.title | Prototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosql | spa |
| dc.title.titleenglish | Prototype Software Tool for the Extraction of Information in PDFf Documents Using a Database Engine nosql | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | spa |
| dc.type.degree | Creación o Interpretación | spa |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | spa |
Archivos
Bloque original
1 - 5 de 6
Cargando...
- Nombre:
- ParraBaqueroAndreaNathaly2017.pdf
- Tamaño:
- 1.98 MB
- Formato:
- Adobe Portable Document Format
No hay miniatura disponible
- Nombre:
- Licencia y Autorización de los Autores para publicar.pdf
- Tamaño:
- 188.63 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- ParraBaqueroAndreaNathaly-1.pdf
- Tamaño:
- 525.39 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- ParraBaqueroAndreaNathaly-2.pdf
- Tamaño:
- 312.95 KB
- Formato:
- Adobe Portable Document Format
Cargando...
- Nombre:
- ParraBaqueroAndreaNathaly-3.pdf
- Tamaño:
- 95.24 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 7 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
