¿Cómo extraer texto de una imagen o documento escaneado?

Imagínate que necesitas poder manipular y editar un texto pero… ups, vaya, te han pasado una imagen JPG o un PDF escaneado, con lo cual no hay más remedio que ir transcribir el texto que se muestra en la imagen en un fichero Word o en un editor de textos. Tedioso, ¿verdad?.

Pues hay una alternativa mucho más cómoda para esta tarea si el texto se ve medianamente bien en la imagen o documento escaneado original.  Y no es otra que usar un programa OCR, que son las siglas en inglés de Reconocimiento Óptico de Caracteres (Optical Character Recognition). Como su nombre indica, este tipo de software actúa como un “ojo inteligente” que es capaz de reconocer el texto que hay en la imagen y ofrecértelo en un fichero de texto (.txt) o de Word (.doc) en algunos casos.

Los OCR más avanzados son capaces incluso de convertir PDF complejos con textos, imágenes, gráficos y tablas a formato Word respetando, dentro de sus posibilidades, el diseño y la maquetación del documento original.

Estos programas son muy fáciles de utilizar. Básicamente tan sólo tienes que indicarle el documento que tienen que analizar y como quieres el resultado, en que formato y donde almacenarlo.

Si lo que necesitas básicamente es poder extraer texto, te recomendamos que utilices un software OCR gratuito, que los hay muy buenos, o directamente utilices alguna web o aplicación online, así podrás tener el texto al momento sin necesidad de instalar nada en tu ordenador o tablet.

A continuación te recomendamos software OCR para usar online o instalar en tu PC o dispositivo Android:

  • Para sistemas Windows:

Es importante comentar que estos métodos no son fiables al 100% y que alguna palabra o dígito puede haberse reconocido erróneamente, así que es casi obligado revisar el texto resultante comparándolo con el original. Sobre todo fijarse en cifras y datos numéricos.

Yo personalmente recurro mucho a este tipo de herramientas cuando tengo que extraer texto de PDF escaneados que ocupan varios párrafos. ¡Imagínate lo que tardarías en transcribirlo si el texto ocupa varias páginas!

Espero que esta información te haya resultado útil y te hayas ahorrado varios minutos o incluso horas de trabajo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *