OCR pdf

Zet gescande documenten en afbeeldingen naar bewerkbare Word, PDF, Excel en Txt (Tekst) output formaten

Upload Bestanden om ze te herkennen of sleep ze naar deze pagina
Bestand kiezen
of slepen en neerzetten bestand

Hoe tekst te herkennen?

Icon of «Bestand uploaden»
stap 1

Bestand uploaden

Selecteer bestand, dat u wilt converteren vanaf uw computer, Google Drive, Dropbox of slepen en neerzetten op de pagina
Icon of «Selecteer taal en uitvoerformaat»
stap 2

Selecteer taal en uitvoerformaat

Selecteer alle talen die in uw document worden gebruikt. Kies ook elk gewenst uitvoerformaat, bijvoorbeeld .doc (meer dan 10 tekstformaten ondersteund)
Icon of «Converteren & Downloaden»
stap 3

Converteren & Downloaden

Klik op de knop " herkennen" en download vervolgens uw bestand met de herkende tekst
Optische tekenherkenning

Optical character recognition or optical character reader (OCR) is de elektronische of mechanische omzetting van afbeeldingen van getypte, handgeschreven of gedrukte tekst in machinaal gecodeerde tekst, hetzij van een gescand document, een foto van een document, een scènefoto (bijvoorbeeld de tekst op borden en billboards in een landschapsfoto) of Van ondertitelingstekst bovenop een afbeelding (bijvoorbeeld van een televisie-uitzending).

Op grote schaal gebruikt als een vorm van gegevensinvoer uit gedrukte papieren gegevensrecords - of paspoort documenten, facturen, bankafschriften, geautomatiseerde ontvangstbewijzen, visitekaartjes, mail, afdrukken van statische gegevens, of een geschikte documentatie-het is een gemeenschappelijke methode voor het digitaliseren van gedrukte teksten, zodat ze elektronisch kunnen worden bewerkt, gezocht, meer compactly opgeslagen, weergegeven online, en gebruikt in machine processen zoals cognitieve computing, machine vertaling, (geëxtraheerd) tekst - naar-spraak, belangrijke gegevens en tekst mining. OCR is een onderzoeksgebied op het gebied van patroonherkenning, kunstmatige intelligentie en computervisie.

Vroege versies moesten worden getraind met afbeeldingen van elk personage, en werkten aan één lettertype per keer. Geavanceerde systemen die in staat zijn om een hoge mate van herkenningsnauwkeurigheid voor de meeste lettertypen te produceren, zijn nu gebruikelijk, en met ondersteuning voor een verscheidenheid aan digitale beeldbestandsindelingen. Sommige systemen zijn in staat om geformatteerde uitvoer te reproduceren die de originele pagina benadert, inclusief afbeeldingen, kolommen en andere niet-tekstuele componenten.