Quería agregar algunos puntos más técnicos al considerar la conversión de PDF a Excel. Supongo que el usuario quiere usar rápidamente las capacidades de edición en Excel y no quiere perder el tiempo para volver a editar todas y cada una de las celdas de Excel.
El verdadero desafío técnico es en circunstancias donde:
a) La estructura tabular en el archivo original PDF no es aparente, esto puede ser por varias razones: es una tabla de texto sin bordes o es una tabla con columnas y filas no alineadas. Este es uno de los puntos donde los proveedores de este tipo de software se diferencian.
b) Hay varias tablas, especialmente no estructuradas colocadas en el documento. Aquí, el software que se usa generalmente tiende a comenzar a tener problemas para reconocer estas estructuras. La mayoría del software aquí depende de bibliotecas externas para la descompasión e identificación de bloques de construcción de PDF elementales.
- ¿Es posible editar un documento PDF en Unix usando alguna herramienta de Unix?
- ¿Cuáles son las diferencias importantes y las similitudes subyacentes entre los convertidores de PDF a texto como Poppler y xpdf?
- Cómo convertir un archivo RTF a PDF
- ¿Es posible convertir un archivo PDF a publicaciones de WordPress como un capítulo a una publicación?
- Cómo convertir un PDF escaneado a texto
c) Existen complicaciones con “,” o “.”, que no permiten distinguir fácilmente entre 1,000 en EE. UU. y 1,000 en Europa
En este caso, la transformación a Excel puede no tener sentido porque Excel considera la entrada de datos como un Texto. Esto dependerá en última instancia de una tecnología proporcionada por terceros, generalmente conocida como OCR. La mayoría del software para convertir a Excel licencia este componente
d) En realidad recibe toneladas de documentos. digamos recibos o facturas o recibos de pago y por alguna razón necesitamos extraer específicamente siempre algunos de los campos de forma masiva. Supongamos que desea obtener el nombre, el apellido y la cantidad pagada por 10 000 recibos de pago. Estas son aplicaciones industriales y desea tener formatos de archivo como XML además de .csv y .xls.
Nos complace recibir comentarios de los usuarios interesados en una de nuestras tecnologías PDF Extractor y PDF Converter, ambos gratuitos.
Por el momento, utilizamos solo una función de varias que tenemos en la versión de escritorio. Por lo tanto, el valor de diferenciación de esta tecnología puede no ser siempre claro. Esta tecnología fue desarrollada en I + D de la universidad bajo subvenciones gubernamentales para el procesamiento de documentos. Ahora estamos tratando de ponerlo a disposición, inicialmente gratis, y nos gustaría identificar a los usuarios beta y los casos de usuarios. Contácteme si tiene casos especiales o si desea obtener más información.
—————————————————————————————————————————————————— ————
RESPUESTA ANTERIOR
Hay otras preguntas y respuestas similares sobre este tema.
Realmente depende del tipo de conversión que esté buscando. En términos generales, puede convertir de PDF a otro formato o viceversa.
Si observa los convertidores de PDF a otra cosa, también se pueden dividir ampliamente en convertidores y extractores reales. Para fines generales, los convertidores uno famoso es Nitro.
Los convertidores básicamente transforman una página en digamos Excel o Word. El extractor está más especializado en mover datos automáticamente a un formato que puede editar y manipular. Por lo tanto, su objetivo principal es hacer que la información sea editable con el menor esfuerzo de tipeo.
Puede encontrar una lista aquí: Extractor de documentos PDF tabulares gratuitos
Estamos trabajando en un nuevo sitio web y un conjunto de servicios gratuitos que puede probar:
Tabex, Tabex,
El servicio gratuito lo ayudará a extraer datos tabulares como facturas, recibos, estados financieros, dibujos técnicos, currículums, etc.
El producto completo tiene muchas más características y está particularmente especializado en extracción por lotes. También puedes mirar:
Página en linkedin.com