在线OCR

将扫描的文档和图像转换为可编辑的Word,PDF,Excel和TXT(文本)输出格式

上传文件识别或拖放到这个页面上
选择文件
或拖放文件

如何识别文本?

Icon of «上传文件»
步骤1

上传文件

选择文件,你想从你的电脑,谷歌驱动器,Dropbox的OCR或拖放页面上
Icon of «选择语言和输出格式»
步骤2

选择语言和输出格式

选择文档中使用的所有语言。 还可以选择任何所需的输出格式,例如。doc(支持超过10种文本格式)或您要转换的任何其他格式(支持超过200种格式)
Icon of «转换和下载»
步骤3

转换和下载

单击"Recognize"按钮,然后使用已识别的文本文件下载文件
光学字符识别

光学字符识别或光学字符识别(OCR)是将打字,手写或印刷文本的图像电子或机械转换为机器编码文本,无论是从扫描文档,文档的照片,场景照片(例如风景照中的标志和广告牌上的文本)还是从叠加在图像上的字幕文本(例如从电视广播)。

广泛用于从打印的纸质数据记录中输入数据的一种形式-无论是护照文件,发票,银行对账单,计算机化收据,名片,邮件,静态数据的打印输出还是任何合适的文档-这是对打印文本进行数字化的常用方法,以便它们可以以电子方式编辑,搜索,更紧凑地存储,在线显示,并用于机器过程,如认知计算,机器翻译,(提取)文本到语音,关键数据和文本挖掘。 OCR是模式识别,人工智能和计算机视觉的研究领域。

早期版本需要使用每个字符的图像进行训练,并一次处理一种字体。 能够为大多数字体产生高度识别准确度的高级系统现在很常见,并且支持各种数字图像文件格式输入。 一些系统能够再现与原始页面紧密接近的格式化输出,包括图像,列和其他非文本组件。