Diría que los errores en una versión electrónica de un libro probablemente se introducen durante el proceso de reconocimiento óptico de caracteres (OCR) . OCR es el proceso de convertir texto escaneado a formato electrónico. [1]
Los editores no siempre tienen una copia digital de un libro, por lo que escanearán el libro físico. Varios factores como la tipografía, la puntuación, la calidad del escaneo, etc., pueden afectar la precisión de OCR. [2] Por ejemplo, un software de OCR puede interpretar una minúscula “l” como una mayúscula “I” o viceversa. El tipo de error puede depender del algoritmo específico utilizado por el software.
Francamente, también es resultado de una mala supervisión. Debe haber alguien que revise un documento de OCR en busca de errores. Las computadoras no son lo suficientemente inteligentes (todavía) para detectar tales errores.
[1] -http: //en.wikipedia.org/wiki/Opt…
[2] -http: //acl.ldc.upenn.edu/W/W96/W…
- ¿Cuáles son las ventajas y desventajas de una prensa académica frente a una prensa comercial para publicar un libro?
- ¿Qué autor obtiene la mayor ganancia por página escrita?
- ¿Por qué los prefacios a veces incluyen la ubicación del autor?
- Después de la expiración de sus derechos de autor, ¿puedo usar un personaje cómico para mi publicación personal?
- ¿Cómo se promueve una novela de fantasía urbana para adultos jóvenes?