日本語

オンラインOCR

スキャンした文書や画像を編集可能なWordやPDF、Excel、およびtxtが(テキスト)出力形式に変換します

テキストを認識する方法?

ステップ1
ファイルをアップロードする -ファイル
お使いのコンピュータ、Googleドライブ、Dropboxのまたはドラッグから変換したいファイルを選択し、ページ上にドロップします
ステップ2
言語と出力形式を選択
あなたのドキュメントで使用されているすべてのlanguagesを選択します。また、任意の所望の出力フォーマットを選択し、例えば、.DOC(10の以上のテキスト形式がサポートされています) またはファイルを変換したいその他フォーマットを選択する。(200以上使用可能なフォーマットあり)
ステップ3
変換&ダウンロード ファイル
「認識」ボタンをクリックして、認識されたテキストを使用してファイルをダウンロード -ファイル
光学式文字認識

光学式文字認識、または光学式文字読取装置(OCR)は、typedの画像の電子的または機械的な変換であり、機械エンコードされたテキストに手書きまたは印刷されたテキスト、スキャンされた文書、文書の写真、シーンの写真からか(例えば、風景写真の標識や看板のテキスト)または(テレビジョン放送からなど)の画像に重畳されたサブタイトルテキスト広く印刷された紙データからデータ入力の形式として用います。

からレコードは - パスポートの書類、請求書、銀行取引明細書、電子化レシート、名刺、メール、静的データのプリントアウト、または任意の適切な文書かどうか - それは、彼らが電子的に編集することができるので、印刷されたテキストをデジタル化する一般的な方法であり、検索、保存されましたよりコンパクトに、オンライン表示、及び処理機械で使用されるような認知コンピューティング、機械翻訳等(抽出された)テキスト - 音声、キーデータ及びテキストマイニング。 OCRは、パターン認識、人工知能やコンピュータビジョンの研究の分野である。

この初期のバージョンでは、各文字の画像で訓練する必要があり、一度に一つのフォントに取り組みました。ほとんどのフォントの認識精度の高い程度を生産することができる高度なシステムは、今や一般的であり、デジタル画像ファイルフォーマット入力のさまざまなサポートしています。いくつかのシステムは密接に画像、列、およびその他の非テキストコンポーネントを含む元のページに近似フォーマットされた出力を再現することができます。