python PyOCR설치 여부, OCR tool설치 경로, 설치 언어를 확인하는 프로그램

python post logo 파이썬

Tesserart-OCR를 어느 경로에 설치 했는지, 설치하는 과정에서 어떤 언어를 선택 했는지, 그리고 PyOCR 추가 패키지를 제대로 설치 했는지, 이 3가지 정보를 표시하기 위한 python으로 프로그램을 작성하는 방법을 소개하겠습니다.

Tesseract 설치하기, PyOCR 설치하기는 이전 글 python PyOCR 문자 인식 프로그램 작성 DigitBuilder를 참조 하십시오.

검증 프로그램 작성

Tesserart-OCR, pyOCR를 설치하고 나서 제대로 된 상태임을 확인하려면 다음 소스를 실행해 보십시오.

소스 해설

  • 6-7행 : pyocr_langs.py가 저장되어있는 디렉토리를 현재 작업 디렉토리로 변경합니다. 자세한 설명은 python 확장자 .py파일 실행할 때 현재 작업 디렉토리 변경하기를 참조 하십시오
  • 9-11행 : “C:\\Program Files\\Tesseract-OCR”가 시스템 환경 변수 %PATH%에 등록되어 있지 않다면 추가합니다.
  • 13-16행 : Tesseract-ocr의 설치에서 문제가 발생했거나 시스템 환경 변수 %PATH%에 설치 경로가 추가 되어있지 않았다면 “OCR tool is not found in path(Tesseract-ocr의 설치 경로)” 메시지를 출력하고 프로그램이 에러 종료됩니다. 그렇지 않다면 OCR tool을 취득해 다음으로 진행합니다.
  • 20행 : 이용 가능한 tool의 모듈 리스트 (여기에서는 pyocr.tesseract 하나만 존재함)를 화면에 출력합니다.
  • 21행 : 모듈 이름을 화면에 출력합니다.
  • 22-23행 :Tesseract 모듈의 OCR 대상 언어 리스트를 화면에 출력합니다.
  • 26행 : “Please Enter to Exit” 메시지를 화면에 출력하면서 Enter키 입력을 기다립니다.

실행 결과

다음은 이용 가능한 tool의 모듈 리스트 (여기에서는 pyocr.tesseract하나 만 존재함) , 모듈 이름, 그리고 Tesseract 모듈의 OCR 대상 언어 리스트를 화면에 출력한 결과입니다.

======================================================================
<module 'pyocr.tesseract' from 'C:\\Users\\userid\\AppData\\Local\\Programs\\Python\\Python39\\lib\\site-packages\\pyocr\\tesseract.py'>
Tesseract (sh)
['eng', 'jav', 'jpn', 'jpn_vert', 'kor', 'osd', 'script/HanS', 'script/HanS_vert', 'script/HanT', 'script/HanT_vert', 'script/Hangul', 'script/Hangul_vert', 'script/Japanese', 'script/Japanese_vert']
======================================================================
Please Enter to Exit
제목과 URL을 복사했습니다