OCR pdf

Konwersji zeskanowanych dokumentów i obrazów w edytowalne Word, PDF, Excel i TXT (tekst) formatów wyjściowych

Prześlij pliki do rozpoznania lub przeciągnij i upuść je na tej stronie
Wybierz plik
lub przeciągnij i upuść plik

Jak rozpoznać tekst?

Icon of «Prześlij plik»
Krok 1

Prześlij plik

Wybierz plik, który chcesz przekonwertować z komputera, dysku Google, Dropbox lub przeciągnij i upuść go na stronie
Icon of «Wybierz język i format wyjściowy»
Krok 2

Wybierz język i format wyjściowy

Wybierz wszystkie języki używane w dokumencie. Wybierz również dowolny żądany format wyjściowy, na przykład .doc (Obsługa ponad 10 formatów tekstu)
Icon of «Konwertuj I Pobierz»
Krok 3

Konwertuj I Pobierz

Kliknij przycisk " Rozpoznaj", a następnie pobierz plik z rozpoznanym tekstem

Optyczne rozpoznawanie znaków

Optyczne rozpoznawanie znaków lub optyczny czytnik znaków (OCR) to elektroniczna lub mechaniczna Konwersja obrazów wpisanego, odręcznego lub drukowanego tekstu na tekst kodowany maszynowo, czy to z zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia sceny (na przykład tekst na znakach i billboardach na zdjęciu krajobrazowym) lub z tekstu napisów nałożonego na obraz (na przykład z transmisji telewizyjnej).

Powszechnie stosowany jako forma wprowadzania danych z drukowanych zapisów danych papierowych - czy to dokumentów paszportowych, faktur, wyciągów bankowych, skomputeryzowanych paragonów, wizytówek, poczty, wydruków danych statycznych lub dowolnej odpowiedniej dokumentacji - jest to popularna metoda digitalizacji drukowanych tekstów, dzięki czemu mogą być edytowane elektronicznie, przeszukiwane, przechowywane bardziej zwarto, wyświetlane on-line i używane w procesach maszynowych, takich jak przetwarzanie kognitywne, tłumaczenie maszynowe, (wyodrębniony) tekst na mowę, kluczowe dane i eksploracja tekstu. OCR jest dziedziną badań w rozpoznawaniu wzorców, sztucznej inteligencji i wizji komputerowej.

Wczesne wersje musiały być szkolone z obrazami każdego znaku i pracowały nad jedną czcionką na raz. Zaawansowane systemy zdolne do uzyskania wysokiego stopnia dokładności rozpoznawania większości czcionek są obecnie powszechne i obsługują wiele cyfrowych formatów plików obrazu. Niektóre systemy są w stanie odtwarzać sformatowane dane wyjściowe, które zbliżają się do oryginalnej strony, w tym obrazów, kolumn i innych elementów nietekstowych.