OCR en línea

Convertir los documentos escaneados e imágenes en archivos editables de Word, PDF, Excel y TXT (texto) formatos de salida

Subir archivos para reconocerlos o arrastrarlos y soltarlos en esta página
Elegir archivo
o arrastrar y soltar archivo

Cómo reconocer texto?

Icon of «Subir archivo»
paso 1

Subir archivo

Seleccione el archivo, que desea OCR desde su computadora, Google Drive, Dropbox o arrastrar y soltar en la página
Icon of «Seleccionar idioma y formato de salida»
paso 2

Seleccionar idioma y formato de salida

Seleccione todos los idiomas utilizados en su documento. También elija cualquier formato de salida deseado, por ejemplo,.doc (admite más de 10 formatos de texto) o cualquier otro formato que desee convertir (admite más de 200 formatos)
Icon of «Convertir y descargar»
paso 3

Convertir y descargar

Haga clic en el "Reconocer" botón y luego descargar el archivo con el archivo de texto reconocido
Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres o lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina, ya sea de un documento escaneado, una foto de un documento, una foto de escena (por ejemplo, el texto en letreros y vallas publicitarias en una foto de paisaje) o de texto de subtítulos superpuestos en una imagen (por ejemplo, de una emisión de televisión).

Ampliamente utilizado como una forma de entrada de datos de registros de datos impresos en papel - ya sean documentos de pasaporte, facturas, estados de cuenta bancarios, recibos computarizados, tarjetas de visita, correo, impresiones de datos estáticos o cualquier documentación adecuada-es un método común de digitalización de textos impresos para que puedan ser editados electrónicamente, buscados, almacenados de manera más compacta, mostrados en línea y utilizados en procesos mecánicos como la computación cognitiva, la traducción automática, (extraídos) texto a voz, datos clave y minería de texto. OCR es un campo de investigación en reconocimiento de patrones, inteligencia artificial y visión por computadora.

Las primeras versiones necesitaban ser entrenadas con imágenes de cada personaje, y trabajadas en una fuente a la vez. Los sistemas avanzados capaces de producir un alto grado de precisión de reconocimiento para la mayoría de las fuentes son ahora comunes, y con soporte para una variedad de entradas de formato de archivo de imagen digital. Algunos sistemas son capaces de reproducir una salida formateada que se aproxima mucho a la página original, incluyendo imágenes, columnas y otros componentes no textuales.