Page 1

UNIVERSISDAD REGIONAL AUTONOMA DE LOS ANDES

ING. EN SISTEMAS ING: LUIS ALBARRACIN INTEGRANTES: JEANNETTE LAVERDE WELLINGTON QUISHPE BRYAN RAMOS


RECONOCIMIENTO OPTICO DE CARACTERES


OCR (RECONOCIMIENTO OPTICO DE CARACTERES) Es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edici贸n de texto.


PROCESO DEL RECONOCIMIENTO OPTICO DE CARCTERES


Binarizacion

Comparaci贸n de patrones

PROCESO OCR

Adelgazamiento de los componentes

Fragmentaci贸n de la imagen


Binarizacion La mayor parte de algoritmos de ROC parten como base de una imagen binaria (dos colores) por lo tanto es conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro. Una forma de hacerlo es mediante el histograma de la imagen donde se muestra el nĂşmero de pixeles para cada nivel de grises que aparece a la imagen.


Fragmentaci贸n de la imagen Durante este proceso se selecciona la zona de inter茅s. Descompone un texto en diferentes entidades l贸gicas, que han de ser suficientemente invariables, para ser independientes del escritor, y suficientemente significativas para su reconocimiento.


Adelgazamiento de los componentes Una vez aisladas las componentes de la imagen, fruto de la fragmentaci贸n del paso anterior se les aplica un proceso de adelgazamiento a cada una. Este procedimiento consiste en ir borrando sucesivamente los puntos de los contornos de cada componente de forma que se conserve su tipolog铆a, simplificando su forma.


Comparaci贸n de patrones Se comparan y reconocen los caracteres obtenidos anteriormente con unos te贸ricos (patrones) almacenados en una base de datos. El buen funcionamiento del OCR se basa en gran medida a una buena definici贸n de esta etapa.


VENTA JAS Y DESVENTA JAS


VENTAJAS Y DESVENTAJAS  La aplicación del OCR permite realizar búsquedas de texto libre sobre la totalidad del documento.  El OCR se puede utilizar para generar índices de palabras clave del texto reconocido de forma automática.  Permite convertir el texto de los documentos digitalizados a formatos editables.

 Hay varias desventajas del servicio del OCR con respecto al coste así como el proceso de reconocer los caracteres. Inicialmente, el coste de desarrollar la reproducción con proceso del OCR puede parecerse lucrativo pero si consideras el coste del ciclo vital entero del sistema del OCR, el coste será mucho más alto que servicio de la entrada de datos.


TECNOLOGIAS OCR


Reconocimiento de texto manuscrito TECNOLOGIAS OCR

Reconocimiento de matr铆culas Indexaci贸n en bases de datos


Reconocimiento de texto manuscrito El reconocimiento de un texto manuscrito continúa siendo un desafío. Aunque el texto se compone básicamente de caracteres individuales, la mayoría de algoritmos ROC no consiguen buenos resultados, ya que la segmentación de texto continuo es un procedimiento complejo.


Reconocimiento de matrículas Una de las aplicaciones son los radares. Estos deben ser capaces de localizar una matrícula de un vehículo con condiciones de iluminación, perspectiva y entorno variables.


Indexación en bases de datos Con el gran aumento de información publicada que ha tenido lugar en los últimos años, cada vez son más los métodos que se utilizan para organizar todo este material almacenado en bases de datos. Uno de estos contenidos son las imágenes.


PROGRAMAS OCR


BENEFICIOS Y UTILIDADES


BENEFICIOS • Búsqueda de documentos con cierta información. • Extracción de la información concreta de un documento. • Pasar de un documento escrito contenido en un archivo de imagen, a un archivo con formato de texto plano.

UTILIDADES • Búsquedas por palabras. • Subrayar y resaltar partes del texto. • Ahorra tiempo para efectuar resúmenes ya que permite copiar y pegar el texto en otros documentos o bien guardar el archivo en formato de MS Word, incluyendo tablas, gráficos, formatos, etc.

Ocr (reconocimiento optico de caracteres)  
Read more
Read more
Similar to
Popular now
Just for you