¿Cómo se introducen los errores en las versiones de libros de Kindle (cuando no existen en las versiones impresas)?

Diría que los errores en una versión electrónica de un libro probablemente se introducen durante el proceso de reconocimiento óptico de caracteres (OCR) . OCR es el proceso de convertir texto escaneado a formato electrónico. [1]

Los editores no siempre tienen una copia digital de un libro, por lo que escanearán el libro físico. Varios factores como la tipografía, la puntuación, la calidad del escaneo, etc., pueden afectar la precisión de OCR. [2] Por ejemplo, un software de OCR puede interpretar una minúscula “l” como una mayúscula “I” o viceversa. El tipo de error puede depender del algoritmo específico utilizado por el software.

Francamente, también es resultado de una mala supervisión. Debe haber alguien que revise un documento de OCR en busca de errores. Las computadoras no son lo suficientemente inteligentes (todavía) para detectar tales errores.

[1] -http: //en.wikipedia.org/wiki/Opt…
[2] -http: //acl.ldc.upenn.edu/W/W96/W…

Los errores a menudo se introducen en la versión del libro electrónico cuando el documento fuente es un PDF. Las palabras con guiones son especialmente problemáticas, aunque también pueden ocurrir otras anomalías. Con respecto al formato, hay demasiado énfasis en duplicar el diseño interior del libro impreso en el eBook. Deben considerarse como dos diseños diferentes. Veo elementos gráficos superfluos, retornos de línea injustificados y usabilidad de TOC. Finalmente, el control de calidad parece quedar en segundo plano en la prisa del editor para sacar las cosas por la puerta.

Hay un punto en el proceso de publicación cuando necesita separar los archivos para las versiones en papel y ebook. Cualquier error nuevo introducido después de este punto solo aparecerá en el formato en el que se esté trabajando.

Si se detectan errores después de la división, es posible que la persona que los detectó no recuerde (o se moleste) en localizarlos y corregirlos en la otra versión.

Además, en algunos títulos, especialmente en títulos más antiguos, el texto fuente puede provenir de diferentes lugares. En algunos casos, la versión impresa proviene de un editor convencional y ha sido revisada por el editor, el editor de copias, el corrector y el autor (generalmente en ese orden) para detectar errores tipográficos y otros errores. Sin embargo, el libro electrónico puede no haber pasado por ese proceso; si proviene de otro editor, o del propio autor, probablemente se derive de los archivos del autor , que no pasaron por las últimas dos etapas del proceso de corrección. Los archivos finales completamente corregidos pertenecen al editor en papel, no al autor o al editor de un libro electrónico.

E incluso si el libro electrónico es del mismo editor que la edición en papel, por una razón u otra puede haberse derivado de un archivo diferente al utilizado para la edición impresa, a menudo un archivo anterior. (Esto es descuidado, pero puede suceder, porque los empleados de las editoriales a menudo son tan vagos y descuidados como cualquier otra persona).