Tesseract는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다.
요즘 스마트폰을 이용해서 글이나 문자를 카메라로 찍어서 사진을 확인해보면.
그 문자들을 인식해서, 복사를 하거나, 검색을 할 수 있는 기능이 있다.
이러한 기능이 바로 OCR(광학문자인식)을 이용한 것이다.
사람이 봤을 때 문자를 인식하는 것은 당연한 거지만, 기계가 이를 수행하기 위해선, 사실상 A.I.(인공지능)을 이용해야만 한다.
그리고 가장 많이 쓰이는 ocr 엔진중의 하나가 바로 'Tesseract' 이다.
https://github.com/tesseract-ocr/tesseract
위 주소는 Tesseract의 공식 Repository이다.
위를 참고해 Tesseract를 설치한 후.
python에서 Tesseract를 사용하기 위해서는 pytesseract와 pillow를 설치해야 한다.
cmd창에서 pip로 설치를 한다.
$pip install pillow
$pip install pytesseract
설치가 끝난후 아래의 예시를 실행시켜 보자.
from PIL import Image
from pytesseract import *
filename = 파일위치 #예시 filename = "C:/Users/lenovo/downloads/ocr/sample.jpg"
image = Image.open(filename)
text = image_to_string(image, lang="kor")
with open("sample.txt", "w") as f:
f.write(text)
위의 코드를 ocr_tesseract.py로 저장 후 실행시키면 sample.txt로 결과가 생성된다.
개발자로서 성장하는 데 큰 도움이 된 글이었습니다. 감사합니다.