martes, 19 de junio de 2012

Sesión 6. EL OCR

Hola a todos, en la clase de hoy quedamos en subir una entrada sobre el OCR. Esto viene a cuento porque uno de los programas que vimos de Ubuntu,llamado Evince que es un lector de FDF también puede leer este formato. Pero ¿En qué consiste? Su mismo nombre lo indica: reconocimiento òptico de caracteres, esto es que vamos a poder tener un texto en formato de imagen y el programa reconocerá exclusivamente los caracteres, por lo que podremos manipularlos con un editor de textos, ahorrando así, el trabajo de captura manual. Esta herramienta es aún más útil cuando son textos largos los que requerimos digitalizar como datos. Pero no es infalible por lo que se debe tener cuidado en que reconozca bien los caracteres. METZTLI 02

2 comentarios:

  1. Orale, que bien! Yo no pude asistir a esa clase,me podrías dar unos pasos sencillos de como llego a ese programa y como lo aplico. Bueno, por mi parte también investigaré. Chido!

    BHP

    ResponderEliminar
  2. Como tú lo mencionas, es muy importante y recomendable revisar el documento final, ya que algunas veces se puede confundir al momento de aplicar el algoritmo de lectura, ya sea por que el documento no es de buena calidad o la separación entre las letras no es el adecuado para el OCR del programa utilizado.

    ResponderEliminar