OCR - pdf

Konvertieren von gescannten Dokumenten und Bildern in bearbeitbare Word, PDF, Excel und Txt (Text) Ausgabeformate

Upload-Dateien zu erkennen oder per Drag & Drop auf dieser Seite
Datei auswählen
oder Drag & Drop-Datei

Wie erkennt man Text?

Icon of «Datei hochladen»
Schritt 1

Datei hochladen

Wählen Sie Datei, die Sie von Ihrem Computer, Google Drive, Dropbox oder per Drag & Drop auf der Seite konvertieren möchten
Icon of «Sprache und Ausgabeformat auswählen»
Schritt 2

Sprache und Ausgabeformat auswählen

Wählen Sie alle in Ihrem Dokument verwendeten Sprachen aus. Wählen Sie auch ein beliebiges Ausgabeformat, zum Beispiel .doc (mehr als 10 Textformate unterstützt)
Icon of «Konvertieren & Herunterladen»
Schritt 3

Konvertieren & Herunterladen

Klicken Sie auf die Schaltfläche "Erkennen" und laden Sie dann Ihre Datei mit dem erkannten Text herunter
Optische Zeichenerkennung

Optical Character Recognition or Optical Character Reader (OCR) ist die elektronische oder mechanische Umwandlung von Bildern von typisiertem, handgeschriebenem oder gedrucktem Text in maschinencodierten Text, sei es aus einem gescannten Dokument, einem Foto eines Dokuments, einem Szenenfoto (z. B. dem Text auf Schildern und Werbetafeln in einem Landschaftsfoto) oder aus Untertiteltext, der einem Bild überlagert ist (z. B. aus einer Fernsehsendung).

Weit verbreitet als eine Form der Dateneingabe aus gedruckten Papierdatensätzen-ob Reisepassdokumente, Rechnungen, Kontoauszüge, computergestützte Quittungen, Visitenkarten, Post, Ausdrucke von statischen Daten oder jede geeignete Dokumentation-es ist eine gängige Methode der Digitalisierung gedruckter Texte, so dass sie elektronisch bearbeitet werden können, gesucht, kompakter gespeichert, online angezeigt und in maschinellen Prozessen wie kognitives Computing, maschinelle Übersetzung, (extrahierte) Textu to-Speech, Schlüsseldaten und Text-Mining verwendet. OCR ist ein Forschungsgebiet in den Bereichen Mustererkennung, künstliche Intelligenz und Computer Vision.

Frühe Versionen mussten mit Bildern jedes Charakters trainiert und jeweils an einer Schriftart gearbeitet werden. Fortschrittliche Systeme, die in der Lage sind, ein hohes Maß an Erkennungsgenauigkeit für die meisten Schriftarten zu erzeugen, sind heute üblich und unterstützen eine Vielzahl digitaler Bilddateiformateingaben. Einige Systeme sind in der Lage, formatierte Ausgaben wiederzugeben, die der Originalseite nahe kommen, einschließlich Bildern, Spalten und anderen nicht-textuellen Komponenten.