Newocr es un programa web gratuito que nos permite analizar múltiples tipos de imágenes y archivos para extraer el texto de ellos, ahorrándonos el tiempo de copiar todo el texto, de un documento o imagen.
Su uso es sencillo, solo debemos de seleccionar el archivo o añadir la url donde se encuentra, subirlo a la web y seleccionar el idioma del texto.
Posteriormente nos permitirá rotar el archivo para colocarlo de forma correcta, y seleccionar el área con textos que hay, por si existe algún fallo.
Por ultimo presionaremos "OCR" y el programa analizara el archivo y nos ofrecerá el análisis al final de la web.
Desde hay podremos guardar el análisis de texto en diferentes formatos, traducirlo a través de otras herramientas y demás opciones.
A continuación publico los archivos de entrada que soporta:
- JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX
- Compressed files: Unix compress, bzip2, bzip, gzip
- Multi page documents: TIFF, PDF, DjVu
- DOCX, ODT files with images
- Multiple images in ZIP archive
Y ahora los formatos de salida para guardarlo:
- Plain text (TXT)
- Microsoft Word (DOC)
- Adobe Acrobat (PDF)