Online OCR

Konwersji zeskanowanych dokumentów i obrazów w edytowalne Word, PDF, Excel i TXT (tekst) formatów wyjściowych

Prześlij pliki do rozpoznania lub przeciągnij i upuść je na tej stronie

Wybierz plik

lub przeciągnij i upuść plik

Jak rozpoznać tekst?

Krok 1

Prześlij plik

Wybierz sobie jakiś plik, co chcesz przetłumaczyć OCR-em, możesz go wziąć z kompa, albo z Google Drive albo z Dropboxa, albo po prostu przeciągnąć i upuścić na stronie.

Krok 2

Wybierz język i format wyjściowy

No to musisz teraz wybrać wszystkie języki, które występują w tym dokumencie. A poza tym, możesz też wybrać format wyjściowy, np. .doc albo jeszcze inny format, bo jest ponad 200 różnych formatów, które można przekonwertować. Więc wybieraj śmiało!

Krok 3

Konwertuj I Pobierz

Jak już wszystko wybierzesz, to wystarczy, że klikniesz w ten guzik 'Rozpoznaj'. Potem już tylko musisz pobrać ten plik z przetłumaczonym tekstem i będzie git!

Optyczne rozpoznawanie znaków

Optyczne rozpoznawanie znaków lub optyczny czytnik znaków (OCR) to taki sposób przetwarzania obrazów, w którym elektronicznie lub mechanicznie zamienia się tekst wpisany, odręczny lub drukowany na kod komputerowy. Można to zrobić na przykład ze zeskanowanego dokumentu, zdjęcia dokumentu, zdjęcia krajobrazu z widocznym tekstem na billboardach lub na tekst napisany na ekranie telewizora.

OCR, czyli optyczne rozpoznawanie znaków, to popularny sposób na digitalizację drukowanych tekstów. Dzięki niemu możemy elektronicznie edytować, przeszukiwać i przechowywać dokumenty takie jak faktury, wyciągi bankowe czy też wizytówki. OCR znajduje też zastosowanie w procesach maszynowych, jak przetwarzanie kognitywne czy tłumaczenie maszynowe. Ta dziedzina badań skupia się na rozpoznawaniu wzorców, sztucznej inteligencji i wizji komputerowej.

Wcześniejsze wersje programów do OCR wymagały szkolenia z obrazów każdego pojedynczego znaku i obsługiwały tylko jedną czcionkę na raz. Jednak teraz zaawansowane systemy potrafią uzyskać wysoki poziom dokładności przy rozpoznawaniu większości czcionek oraz obsługują wiele cyfrowych formatów plików obrazu. Niektóre z tych systemów są nawet w stanie odtworzyć sformatowane dane wyjściowe, które bardzo zbliżają się do oryginalnej strony, włączając w to obrazy, kolumny oraz inne elementy nietekstowe.