Online OCR
Konwersji zeskanowanych dokumentów i obrazów w edytowalne Word, PDF, Excel i TXT (tekst) formatów wyjściowych
Jak rozpoznać tekst?
Prześlij plik
Wybierz język i format wyjściowy
Konwertuj I Pobierz
Optyczne rozpoznawanie znaków
Optyczne rozpoznawanie znaków lub optyczny czytnik znaków (OCR) to elektroniczna lub mechaniczna Konwersja obrazów wpisanego, odręcznego lub drukowanego tekstu na tekst kodowany maszynowo, czy to z zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia sceny (na przykład tekst na znakach i billboardach na zdjęciu krajobrazowym) lub z tekstu napisów nałożonego na obraz (na przykład z transmisji telewizyjnej).
Powszechnie stosowany jako forma wprowadzania danych z drukowanych zapisów danych papierowych - czy to dokumentów paszportowych, faktur, wyciągów bankowych, skomputeryzowanych paragonów, wizytówek, poczty, wydruków danych statycznych lub dowolnej odpowiedniej dokumentacji - jest to popularna metoda digitalizacji drukowanych tekstów, dzięki czemu mogą być edytowane elektronicznie, przeszukiwane, przechowywane bardziej zwarto, wyświetlane on-line i używane w procesach maszynowych, takich jak przetwarzanie kognitywne, tłumaczenie maszynowe, (wyodrębniony) tekst na mowę, kluczowe dane i eksploracja tekstu. OCR jest dziedziną badań w rozpoznawaniu wzorców, sztucznej inteligencji i wizji komputerowej.
Wczesne wersje musiały być szkolone z obrazami każdego znaku i pracowały nad jedną czcionką na raz. Zaawansowane systemy zdolne do uzyskania wysokiego stopnia dokładności rozpoznawania większości czcionek są obecnie powszechne i obsługują wiele cyfrowych formatów plików obrazu. Niektóre systemy są w stanie odtwarzać sformatowane dane wyjściowe, które zbliżają się do oryginalnej strony, w tym obrazów, kolumn i innych elementów nietekstowych.