OCRjpeg

スキャンした文書や画像を、編集可能なWordやPDF、Excel、およびtxt (テキスト)の形式に変換します。

文字を認識する方法は?

Icon of «ファイルをアップロード»
ステップ1

ファイルをアップロード

パソコン、Google Drive、DropboxからOCRを行いたいファイルを選択するか、ページ上にドラッグアンドドロップしてアップロードしてください。
Icon of «言語と出力形式を選択»
ステップ2

言語と出力形式を選択

あなたの文書で使用されるすべての言語を選択します。また、希望する出力形式を選択します。例えば、.doc(10以上のテキスト形式がサポートされています)
Icon of «変換&ダウンロード»
ステップ3

変換&ダウンロード

「認識」ボタンを押して、認識されたテキストファイルをダウンロードしてください。

光学式文字認識

光学式文字認識(OCR)は、スキャンした文書、写真、シーン写真(風景の写真や看板のテキストなど)、または字幕テキスト(テレビ放送など)から、手書きまたは印刷されたテキストの画像を電子的に変換する技術です。

パスポート、請求書、銀行取引明細書、コンピュータで処理された領収書、名刺、郵便物、静的なデータのプリントアウトなど、印刷された紙のデータを電子データに変換するために使用されているのが一般的です。印刷されたテキストをデータ化することで、電子的に編集、検索、圧縮し保存、オンラインで表示し、言語処理、機械翻訳、音声合成、重要なデータやテキストマイニングなどの機械処理に使用することができます。 OCRは、パターン認識、人工知能、コンピュータビジョンの研究分野です。

初期バージョンは、各文字の画像をトレーニングする必要があり、一度に1つのフォントしか処理できませんでした。しかし、現在は、ほとんどのフォントの認識精度が高い高性能なシステムが一般的になり、様々なデジタル画像ファイル形式に対応しています。また、画像や段落、その他の非テキスト要素を含む、元のページに近い形式の出力を再現できるシステムもあります。