Cómo extraer fácilmente texto de un archivo PDF de dos columnas

De su pregunta deduzco que solo desea el texto. Si puede copiar desde este PDF * (algunos PDF tienen configuraciones de protección que limitarían lo que puede hacer con él), puede usar Pegar atributos que coincidan con el documento de destino. Si utiliza un sistema operativo Mac, puede pegar el texto copiado con estas teclas: MAYÚS + ALT + CMD + V. En Windows, deberá copiar el texto, y cuando lo pegue en el documento de destino, debe hacer clic en el botón Opciones de pegado y elija Hacer coincidir formato de destino o Mantener solo texto.

También podría funcionar mejor si primero copia el texto de la primera columna (usando las opciones de pegado descritas anteriormente) y luego copia y pega la segunda columna.

Algunos archivos PDF tienen atributos y configuraciones que causan problemas al copiar y pegar (por ejemplo, problemas con respecto al espacio entre palabras y letras, la forma en que se muestran los caracteres especiales, etc.), por lo que también puede verificar esa configuración. Es posible que deba descargar un software que le permita editar y / o cambiar atributos en archivos PDF. Si un documento es muy seguro (protegido por contraseña más otras configuraciones de seguridad), es posible que no pueda copiar el texto. Luego, deberá utilizar un software que escanee el texto físico (en un papel) y luego convertirlo en texto electrónico, pero esto a menudo tiene problemas de formato y puede que no sea preciso, por lo que deberá corregir el texto convertido.

¡Espero que esto ayude!

* Esperaba que algunos usuarios de Quora señalaran que PDF ya contiene la palabra “archivo” (Archivo de documento portátil), por lo que descarté la palabra “archivo”. ¡Pero la mayoría de las personas se refieren a él como archivos PDF!

Puede convertir PDF a Word con CleverPDF, servicio gratuito en línea. Admite PDF con varias columnas y mantiene el contenido correctamente en el archivo de Word de salida.

PDF to Word Converter Free – CleverPDF.com

Simplemente cargue su archivo PDF y haga clic en “Iniciar conversión”, obtendrá el documento de Word de salida al instante.

Hola,

Si su preocupación es extraer texto de archivos PDF. Entonces definitivamente debe considerar un software de terceros para extraer texto pdf de archivos PDF.

Seguir el Enfoque manual para la extracción de texto en PDF puede dañar algunos archivos PDF.

Le sugiero que use una herramienta para extraer texto PDF.

Gracias y Saludos

Sandra Diaz

Puede probar las siguientes 2 formas de extraer texto de PDF: programa PDF gratuito en línea y programa PDF de escritorio.

Programa gratuito en línea :

  1. Ir a onlineocr
  2. Subir PDF al programa
  3. Elija la salida como texto y haga clic en “Convertir”

Programa PDF de escritorio

Cisdem PDF Converter OCR para Mac: convierta archivos PDF nativos, escaneados y seguros en texto y otros 15 formatos.

Importe archivos arrastrando y soltando> elija la salida como Texto> Convertir

Readiris 16 para Windows: convierta archivos PDF nativos y escaneados a 12 formatos de salida, también puede administrar y editar los archivos PDF dentro de este programa.