Prototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosql

dc.contributor.advisorOrdoñez Salinas, Sonia del Carmenspa
dc.contributor.authorParra Baquero, Andrea Nathalyspa
dc.contributor.authorRobles Morales, Edison Armandospa
dc.date.accessioned2017-12-20T17:07:02Z
dc.date.available2017-12-20T17:07:02Z
dc.date.created2017-11-21spa
dc.descriptionEn este trabajo se presenta el desarrollo de una herramienta de extracción de información para documentos PDF, cuyo funcionamiento se basa en la combinación de técnicas de rastreo de información, reconocimiento óptico de caracteres y patrones de extracción de información. El principal objetivo es permitir la búsqueda de entidades nombradas en documentos PDF que se encuentran alojados en un dominio específico.spa
dc.description.abstractThis paper presents the development of an information extraction tool for PDF documents, whose operation is based on the combination of information tracking techniques, optical character recognition and information extraction patterns. The main objective is allow the search of named entities in PDF documents that are hosted in a specific domain.spa
dc.format.mimetypepdfspa
dc.identifier.urihttp://hdl.handle.net/11349/7308
dc.language.isospaspa
dc.rightsAtribución-NoComercial-SinDerivadas 4.0 Internacional*
dc.rights.accesoRestringido (Solo Referencia)spa
dc.rights.accessrightsinfo:eu-repo/semantics/restrictedAccessspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectOCRspa
dc.subjectCrawlerspa
dc.subjectNLTKspa
dc.subjectExtracciónspa
dc.subject.keywordOCRspa
dc.subject.keywordCrawlerspa
dc.subject.keywordNLTKspa
dc.subject.keywordExtractspa
dc.subject.lembINGENIERÍA DE SISTEMAS - TESIS Y DISERTACIONES ACADÉMICASspa
dc.subject.lembRECUPERACIÓN DE INFORMACIÓN - PROGRAMAS PARA COMPUTADORspa
dc.subject.lembDESARROLLO DE PROGRAMAS PARA COMPUTADORspa
dc.subject.lembLINGÜÍSTICA COMPUTACIONALspa
dc.titlePrototipo de Herramienta de Software para la Extracción de Información en Documentos PDFf Utilizando un Motor de Base de Datos nosqlspa
dc.title.titleenglishPrototype Software Tool for the Extraction of Information in PDFf Documents Using a Database Engine nosqlspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.degreeCreación o Interpretaciónspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa

Archivos

Bloque original

Mostrando 1 - 5 de 6
Cargando...
Miniatura
Nombre:
ParraBaqueroAndreaNathaly2017.pdf
Tamaño:
1.98 MB
Formato:
Adobe Portable Document Format
No hay miniatura disponible
Nombre:
Licencia y Autorización de los Autores para publicar.pdf
Tamaño:
188.63 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
ParraBaqueroAndreaNathaly-1.pdf
Tamaño:
525.39 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
ParraBaqueroAndreaNathaly-2.pdf
Tamaño:
312.95 KB
Formato:
Adobe Portable Document Format
Cargando...
Miniatura
Nombre:
ParraBaqueroAndreaNathaly-3.pdf
Tamaño:
95.24 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
7 KB
Formato:
Item-specific license agreed upon to submission
Descripción: