Computacion

Ξ 42 comentarios

Cómo extraer texto de una imagen

por ToPHeR
Cómo extraer texto de una imagen

Hola amigos de CómoLoHago,  mas de alguna vez nos ha pasado que hemos escaneado algún documento o libro y deseamos editar su contenido, pero lamentablemente tenemos el texto del libro en formato imagen (Jpg,Gif, etc …) o simplemente con nuestra cámara de fotos le sacamos fotos a texto.

Es por eso que luego del salto les mostraremos 2 alternativas para convertir esas imágenes en texto y así poder editar la información.

Cómo extraer texto de una imagen

Utilizaremos el método conocido como OCR que sus siglas corresponden a Optical Charater Recognition, o en su traducción, reconocimiento óptico de caracteres.

Para lograr esto utilizaremos el software FreeOCR V3 el cual puedes descargar desde el siguiente enlace.

Si bien, el programa es gratis, este no es tan bueno ni exacto como los programas de pagados como el ABBYY FineReader (el cual trae una versión trial por 15 días o 20 impresiones).

Una vez descargado, procederemos a instalar la aplicación, lo cual no nos traerá ningún inconveniente.

Ahora ejecutaremos nuestra aplicación y tendremos una interfaz como la siguiente.

Luego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo, luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:\WINDOWS\tessdata  y reiniciamos nuestro programa.

Seguido a esto haremos click en OPEN y elegimos la imagen a la cual deseemos extraer el texto.

Ahora solo nos resta marcar la opción OCR y esperaremos a ver los resultados.

En lo personal el programa no es de mi total agrado,  ya que este  falla bastante al no detectar 100% un tipo de fuente predefinida,  es por eso que a continuación les traemos otra opción, más simple y rápida.

Nuestra segunda opción es un servicio Web, al cual podemos ingresar por la dirección: http://www.free-ocr.com/ en donde nos encontraremos con la siguiente página.

En donde marcaremos examinar, donde elegiremos la imagen a transformar en texto, luego escogemos el idioma, rellenamos el sistema de seguridad (re-captcha) y haremos click en “Send File”.

Esperamos unos segundos y se desplegara una nueva pantalla con el texto extraído de la imagen que seleccionamos anteriormente.

Por último les traemos una tercera y cuarta  opción, las cuales también son  servicios Web. Se trata de http://www.ocrterminal.com/, un sitio en el cual debemos registrarnos y se nos permitirá “scannear” hasta 20 páginas gratis, para luego cobrarnos por volumen mensual “scanneado”. Por último el sitio http://www.newocr.com/ el cual es muy similar al Free-Ocr y es completamente gratis.

Con esto me despido, sin antes recordarles que este tutorial ha sido…

Cualquier duda o comentario que puedan tener, pueden realizarlos en el área habilitada a continuación.

Esperamos que este tutorial les haya sido de utilidad.

Será hasta una próxima oportunidad.

Comparte este tutorial

El culpable de todo esto

Topher se ha ganado con sudor, lágrimas y productos naturales una maestría en Tragos y Cocina. Sin embargo, no todo ha sido laureles en la vida de este calvo generador de contenidos. Luego de ser elegido Alcalde de Ciudad Gótica, tuvo que pagar el costo de ser una personalidad pública, ligado a las más diversas figuras de la farándula nacional e internacional. Debido a eso, se sometió a una costosa e innovadora cirugía de implantes de rodilla con el fin de crecer 32,5 cms y poder subirse a la montaña rusa de Felicilandia en donde compartió asiento con Xabadu, quien lo reclutó para CLH en donde, a pesar de mantener un bajo perfil, tiene a la mitad de México demandándolo por la Michelada.

En los barrios marginales se le conoce como: ToPHeR

Comentarios en Facebook

42 Comentarios

1 3 4 5

Responder a Nelson Cancelar respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Gente linda que nos quiere

Donde mas estamos