OCRjpeg

편집 가능한 워드, PDF, 엑셀, TXT를 (텍스트) 출력 형식으로 변환 스캔 한 문서 및 이미지

텍스트를 인식하는 방법?

Icon of «파일 업로드»
1 단계

파일 업로드

변환하려면 컴퓨터, Google Drive 또는 Dropbox에서 원하는 파일을 선택합니다. 파일을 페이지로 직접 끌어다 놓을 수도 있습니다.
Icon of «언어 및 출력 형식 선택»
2 단계

언어 및 출력 형식 선택

문서에 사용된 모든 언어를 선택하고 .doc 등 원하는 출력 형식(지원되는 10가지 이상의 텍스트 형식 외에)을 선택합니다.
Icon of «변환 및 다운로드»
3 단계

변환 및 다운로드

"인식"인식 버튼을 클릭하고 인식된 텍스트가 포함된 파일을 다운로드합니다.

광학 문자 인식

'광학 문자 인식' 또는 'OCR'로 알려진 기술을 사용하면 타이핑, 필기 또는 인쇄된 텍스트를 전자적 또는 기계적으로 기계가 읽을 수 있는 인코딩된 텍스트로 변환할 수 있습니다. 스캔한 문서, 문서 사진, 장면 이미지(예: 풍경 사진 속 간판이나 광고 포스터의 텍스트) 또는 이미지에 겹쳐진 자막 텍스트(예: 텔레비전 프로그램 자막)에서 이 작업을 수행할 수 있습니다.

광학 문자 인식의 약자인 OCR은 여권, 청구서, 은행 명세서, 영수증, 명함, 이메일, 정적 데이터 출력물 또는 기타 유형의 문서와 같은 종이 문서에서 데이터를 디지털 형식으로 입력하는 방법으로 널리 사용됩니다. 이를 통해 인쇄된 텍스트를 디지털화하여 전자적으로 관리하고, 검색하고, 더 컴팩트하게 저장하고, 온라인으로 보고, 인지 컴퓨팅, 기계 번역, 텍스트 음성 변환 및 데이터 마이닝과 같은 자동화된 프로세스에 사용할 수 있습니다. OCR은 패턴 인식, 인공 지능, 컴퓨터 비전과 관련된 연구 분야입니다.

과거에는 이러한 시스템의 초기 버전은 개별 문자의 이미지로 학습해야 했고 한 번에 하나의 글꼴로만 작업할 수 있었습니다. 그러나 이제는 다양한 디지털 이미지 파일 형식을 지원하여 대부분의 글꼴에 대해 높은 인식 정확도를 제공하는 고급 시스템을 사용할 수 있습니다. 또한 일부 시스템은 이미지, 열 및 기타 비텍스트 요소를 포함하여 서식이 지정된 출력을 원본 페이지에 매우 가깝게 재현할 수 있습니다.