OCR Online

Converter de documentos digitalizados e imagens em editável Word, PDF, formatos de saída do Excel e Txt (texto)

Como reconhecer texto?

Icon of «Enviar o ficheiro»
Passo 1

Enviar o ficheiro

Selecione o arquivo, que você quer OCR do seu computador, Google Drive, Dropbox ou drag e deixá-lo na página
Icon of «Seleccionar a língua e o formato de saída»
Passo 2

Seleccionar a língua e o formato de saída

Seleccione Todas as línguas utilizadas no seu documento. Escolha também qualquer formato de saída desejado, por exemplo .doc (mais de 10 formatos de texto suportados) ou qualquer outro formato, que você deseja converter (mais 200 formatos suportados)
Icon of «Converter E Transferir»
Passo 3

Converter E Transferir

Carregue no botão "reconhecer" e depois baixe o seu ficheiro com o ficheiro de texto reconhecido

Reconhecimento óptico de caracteres

Reconhecimento óptico de caracteres ou leitor óptico de caracteres (OCR) é o eletrônico ou mecânico de conversão de imagens de datilografado, manuscrito ou texto impresso em máquina de texto codificado, seja a partir de um documento digitalizado, uma foto de um documento, uma cena-fotografia (por exemplo, o texto em placas e outdoors em uma foto de paisagem) ou a partir de texto de legendas sobrepostas a uma imagem (por exemplo, a partir de uma transmissão de televisão).

Amplamente utilizado como um formulário de entrada de dados a partir de papel impresso dados de registos - se de passaporte, documentos, faturas, extratos bancários, computadorizado de recibos, cartões de visita, e-mail, impressão de dados estáticos, ou qualquer documentação adequada - é um método comum de digitalização de textos impressos, de forma que eles pode ser editado eletronicamente, pesquisados, armazenados mais compacta, exibidos on-line, e usado em máquina de processos, tais como a cognitiva, a computação, a máquina de tradução, (extraído de texto-para-fala, chave de dados e mineração de texto. OCR é um campo de pesquisa em reconhecimento de padrões, inteligência artificial e visão de computador.

As primeiras versões precisavam ser treinadas com imagens de cada personagem, e trabalhadas em uma fonte de cada vez. Sistemas avançados capazes de produzir um alto grau de precisão de reconhecimento para a maioria das fontes são agora comuns, e com suporte para uma variedade de entradas de formato de arquivo de imagem digital. Alguns sistemas são capazes de reproduzir uma saída formatada que se aproxima da página original, incluindo imagens, colunas e outros componentes não textuais.