Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Algoritmos para el reconocimiento de estructuras de tablas

View through CrossRef
Las Tablas son una manera bien común de organizar y publicar datos. Por ejemplo, la Web posee un enorme número de tablas publicadas en HTML integradas en documentos PDF, o que pueden ser simplemente descargadas de páginas Web. Sin embargo, las tablas no siempre son fáciles de interpretar pues poseen una gran variedad de características y son organizadas en diferentes formatos. De hecho, se han desarrollado un gran número de métodos y herramientas para la interpretación de tablas. Este trabajo presenta la implementación de un algoritmo, basado en Campos Aleatorios Condicionales (CRF, Conditional Random Fields), para clasificar las filas de una tabla como fila de encabezado, fila de datos y fila metadatos. La implementación se complementa con dos algoritmos para reconocer tablas en hojas de cálculos, específicamente, basados en reglas y detección de regiones. Finalmente, el trabajo describe los resultados y beneficios obtenidos por la aplicación del algoritmo para tablas HTML, obtenidas desde la Web, y las tablas en forma de hojas de cálculo, descargadas desde el sitio Web de la Agencia Nacional de Petróleo de Brasil.
Salesian Polytechnic University of Ecuador
Title: Algoritmos para el reconocimiento de estructuras de tablas
Description:
Las Tablas son una manera bien común de organizar y publicar datos.
Por ejemplo, la Web posee un enorme número de tablas publicadas en HTML integradas en documentos PDF, o que pueden ser simplemente descargadas de páginas Web.
Sin embargo, las tablas no siempre son fáciles de interpretar pues poseen una gran variedad de características y son organizadas en diferentes formatos.
De hecho, se han desarrollado un gran número de métodos y herramientas para la interpretación de tablas.
Este trabajo presenta la implementación de un algoritmo, basado en Campos Aleatorios Condicionales (CRF, Conditional Random Fields), para clasificar las filas de una tabla como fila de encabezado, fila de datos y fila metadatos.
La implementación se complementa con dos algoritmos para reconocer tablas en hojas de cálculos, específicamente, basados en reglas y detección de regiones.
Finalmente, el trabajo describe los resultados y beneficios obtenidos por la aplicación del algoritmo para tablas HTML, obtenidas desde la Web, y las tablas en forma de hojas de cálculo, descargadas desde el sitio Web de la Agencia Nacional de Petróleo de Brasil.

Related Results

PREVENÇÃO DA TROMBOSE VENOSA PROFUNDA NA GRAVIDEZ PELA ENFERMAGEM NA APS
PREVENÇÃO DA TROMBOSE VENOSA PROFUNDA NA GRAVIDEZ PELA ENFERMAGEM NA APS
PREVENÇÃO DA TROMBOSE VENOSA PROFUNDA NA GRAVIDEZ PELA ENFERMAGEM NA APS Danilo Hudson Vieira de Souza1 Priscilla Bárbara Campos Daniel dos Santos Fernandes RESUMO A gravidez ...
Diseño de modelos y algoritmos para el procesamiento de datos SAR polarimétricos
Diseño de modelos y algoritmos para el procesamiento de datos SAR polarimétricos
Un sistema SAR es un radar aerotransportado o satelital que sensa la superficie terrestre y forma imágenes para su estudio. Funciona emitiendo ondas electromagnéticas sobre la zona...
Application of BIM visual programming algorithms for infrastructure projects
Application of BIM visual programming algorithms for infrastructure projects
(English) The BIM digitization has generated a growing automation of traditional AECO project development processes. However, this automation has mainly benefited building projects...
Contato pele a pele na primeira hora de vida do recém-nascido sob o olhar materno
Contato pele a pele na primeira hora de vida do recém-nascido sob o olhar materno
Identificar, por meio de relatos das puérperas, a experiência do contato pele a pele (mãe-filho) na primeira hora de vida do recém-nascido. Estudo descritivo, prospectivo de abord...
A paradigm shift of HPC for geosciences: a novel HPC service model for geosciences applications
A paradigm shift of HPC for geosciences: a novel HPC service model for geosciences applications
(English) The Oil and Gas (O&G) industry ranks prominently among the leading commercial users of powerful supercomputers worldwide, as indicated by global High-Performance Comp...
Caracterización metamórfico-estructural del basamento de bajo grado entre Nahuel Niyeu y Aguada Cecilio, Macizo Norpatagónico, Río Negro
Caracterización metamórfico-estructural del basamento de bajo grado entre Nahuel Niyeu y Aguada Cecilio, Macizo Norpatagónico, Río Negro
La Formación Nahuel Niyeu de bajo grado metamórfico es una unidad geológica esencialmente metasedimentaria, con extensos afloramientos entre las localidades rionegrinas de Nahuel N...
EFECTO DE LA DEFORMACIÓN PLÁSTICA EN LAS ESTRUCTURAS DE PAVIMENTO FLEXIBLE
EFECTO DE LA DEFORMACIÓN PLÁSTICA EN LAS ESTRUCTURAS DE PAVIMENTO FLEXIBLE
En Colombia, uno de los daños más frecuentes de las estructuras de pavimento flexible es la deformación plástica conocida comúnmente como el ahuellamiento, el cual consiste en una ...
Pedagogí­a Crí­tica
Pedagogí­a Crí­tica
Bórquez Bustos, Rodolfo Trillas, 2006 El libro presentado por Bórquez muestra un recorrido por las distintas corrientes ideológicas ligadas con la modernidad, primero desde un punt...

Back to Top