Cómo traducir imágenes con texto dentro a formato legible por máquina

Voy a suponer aquí que por máquina te refieres a una computadora y por legible te refieres a la capacidad de las computadoras para distinguir el color, manipular el tamaño de píxeles, etc.

Lo que necesita saber primero es que cada imagen está compuesta de píxeles (esto puede considerarse como un único punto o punto en la imagen) y generalmente cada píxel tiene 3 valores llamados RGB (Rojo, Verde y Azul. A veces hay otros componentes como el tono, la saturación, etc.). Volviendo al tema en cuestión:
Cada imagen puede considerarse como una matriz. Y cada elemento en la matriz es el ‘punto’ o valor de píxel del que hablamos. Por lo tanto, cuando ve una imagen de resolución de 800 × 600, significa que hay 800 filas y 600 columnas.

En los programas en los que se va a cargar una imagen en una variable para que la lea la ‘máquina’, se almacena como una matriz “mxn”. Entonces los elementos de la matriz pueden leerse individualmente o manipularse. Pocos ejemplos:

Python :

import os, sys
importar imagen
jpgfile = Image.open (“picture.jpg”)

imprimir jpgfile.bits, jpgfile.size, jpgfile.format

MATLAB

jpgfile = imread (‘picture.jpg’);

Si desea obtener más información, puede leer sobre OpenCV o la guía aquí en: http://docs.opencv.org/2.4/doc/t…

¡Espero que esto ayude! 🙂

formato legible por máquina? ¿Se refiere a un formato editable, legible y con capacidad de búsqueda en la computadora? En caso afirmativo, puede intentar lo siguiente:

Use la función OCR incorporada en Google Docs para hacer esto:

  1. Inicie sesión en su cuenta de Google e ingrese en Google Drive;
  2. Haga clic en “Nuevo” en el panel izquierdo> Carga de archivos, para cargar el archivo que necesita hacer OCR;
  3. Una vez cargado, el archivo aparecerá en el área principal, haga clic derecho para “Abrir con Google Docs”, el OCR se realizará automáticamente;
  4. Una vez finalizado, el contenido se mostrará en Google Docs, vaya a “Archivo”> ​​”Descargar como” para elegir el formato en el que desea guardar los PDF o imágenes escaneados.

fuente de: 10 potentes herramientas de OCR en línea / gratuitas que los usuarios de Mac utilizan con frecuencia

Si la imagen tiene texto dentro, el software de reconocimiento óptico de caracteres puede ayudarlo a recuperar texto de la imagen que tiene, como Docs Matter.

Luego, puede convertirlo en archivos con formato de búsqueda y lectura, como Word, PDF, Texto.

¿Eso es lo que quieres?