Нидерландский OCR

Преобразовать отсканированные документы и изображения в редактируемые Word, PDF, Excel и TXT (текст) форматы вывода

Загрузите файлы для распознавания или перетащите их на страницу

Выберите файл

или перетащите файл

Как распознать текст?

Шаг 1

Загрузить файл

Выберите файл, который вы хотите конвертировать с вашего компьютера, Google Drive, Dropbox или перетащите его на страницу

Шаг 2

Выберите язык и формат вывода

Выберите все языки, используемые в документе. Также выберите любой желаемый формат вывода, например .doc (поддерживается более 10 текстовых форматов)

Шаг 3

Конвертировать и скачать файл

Нажмите на кнопку "Распознать", а затем скачайте файл с распознанным текстом файл

Оптическое распознавание символов

Оптическое распознавание символов или оптическое считывание символов (OCR) - это электронное или механическое преобразование изображений рукописного или печатного текста в машинный код, будь то отсканированный документ, фотография документа, фотография сцены (например, текст на знаках и рекламных щитах на альбомной фотографии) или из текста субтитров, наложенного на изображение (например, из телевизионной трансляции).

Широко используется как форма ввода данных из печатных бумажных данных, будь то паспортные документы, накладные, банковские выписки, компьютеризированные квитанции, визитные карточки, почта, распечатки статических данных или любая подходящая документация - это распространенный метод оцифровки печатных текстов, чтобы их можно было редактировать, искать, хранить в электронном виде более компактно, отображается в режиме онлайн и используется в машинных процессах, таких как когнитивные вычисления, машинный перевод, (извлеченный) преобразование текста в речь, ключевые данные и анализ текста. OCR - это область исследований в области распознавания образов, искусственного интеллекта и компьютерного зрения.

В ранних версиях нужно было тренироваться с изображениями каждого персонажа и работать с одним шрифтом за раз. В настоящее время распространены современные системы, способные обеспечить высокую степень распознавания для большинства шрифтов, с поддержкой различных входных форматов файлов цифровых изображений. Некоторые системы способны воспроизводить форматированный вывод, который близко соответствует исходной странице, включая изображения, столбцы и другие нетекстовые компоненты.