Me temo que es muy difícil …
Hay algunas señales que pueden revelar la fuente del texto:
El texto contiene finales de línea inusuales . Acrobat no siempre puede asumir correctamente si el texto final es una oración completa, que termina cerca del margen derecho, es el final del párrafo o simplemente un salto de línea.
El texto como tablas y las listas con viñetas o numeradas se pierden. Un procesador de textos competente escribiría dicho texto adecuadamente, con las pestañas correctas y todo. Acrobat podría tener problemas para reconstruir dicho texto, según el software que creó el PDF.
- ¿Qué son los archivos PDF accesibles?
- Cómo proteger un PDF para evitar compartir archivos
- ¿Por qué se recomienda usar PDF?
- Cómo sacar una página de un archivo PDF
- ¿Cómo se puede abrir el archivo PDF?
El texto muy formateado con muchos encabezados probablemente también se extravíe en algunos puntos.
Entidades extrañas en el texto, que deberían haber sido caracteres especiales. Antes de los días de Unicode , las fuentes con TrueType o tecnología más antigua fácilmente mezclaban caracteres especiales en tipos de letra o aplicaciones. Sin la lectura de prueba del texto citado, tales errores pasarían desapercibidos.
Errores tipográficos adicionales, no en el original . Si el texto en Acrobat ha sido editado y revisado a fondo, seguramente habrá menos errores tipográficos que en el texto recién escrito.
Pero como puede concluir, estos signos no son muy persistentes. Cualquier editor puede detectarlos y corregirlos rápidamente, lo que dificulta ver una diferencia.