OCR jpeg

Преобразовать отсканированные документы и изображения в редактируемые Word, PDF, Excel и TXT (текст) форматы вывода

Как распознать текст?

Icon of «Загрузить файл»
Шаг 1

Загрузить файл

Выберите файл, который вы хотите конвертировать с вашего компьютера, Google Drive, Dropbox или перетащите его на страницу
Icon of «Выберите язык и формат вывода»
Шаг 2

Выберите язык и формат вывода

Выберите все языки, используемые в документе. Также выберите любой желаемый формат вывода, например .doc (поддерживается более 10 текстовых форматов)
Icon of «Конвертировать и скачать файл»
Шаг 3

Конвертировать и скачать файл

Нажмите на кнопку "Распознать", а затем скачайте файл с распознанным текстом файл

Оптическое распознавание символов

Оптическое распознавание символов или оптическое считывание символов (OCR) - это электронное или механическое преобразование изображений рукописного или печатного текста в машинный код, будь то отсканированный документ, фотография документа, фотография сцены (например, текст на знаках и рекламных щитах на альбомной фотографии) или из текста субтитров, наложенного на изображение (например, из телевизионной трансляции).

Широко используется как форма ввода данных из печатных бумажных данных, будь то паспортные документы, накладные, банковские выписки, компьютеризированные квитанции, визитные карточки, почта, распечатки статических данных или любая подходящая документация - это распространенный метод оцифровки печатных текстов, чтобы их можно было редактировать, искать, хранить в электронном виде более компактно, отображается в режиме онлайн и используется в машинных процессах, таких как когнитивные вычисления, машинный перевод, (извлеченный) преобразование текста в речь, ключевые данные и анализ текста. OCR - это область исследований в области распознавания образов, искусственного интеллекта и компьютерного зрения.

В ранних версиях нужно было тренироваться с изображениями каждого персонажа и работать с одним шрифтом за раз. В настоящее время распространены современные системы, способные обеспечить высокую степень распознавания для большинства шрифтов, с поддержкой различных входных форматов файлов цифровых изображений. Некоторые системы способны воспроизводить форматированный вывод, который близко соответствует исходной странице, включая изображения, столбцы и другие нетекстовые компоненты.