Tesseract (테서렉트)를 이용한 문자인식

Min Jae Cho·2023년 8월 14일

AI정보

목록 보기

3/24

Tesseract는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다.

요즘 스마트폰을 이용해서 글이나 문자를 카메라로 찍어서 사진을 확인해보면.
그 문자들을 인식해서, 복사를 하거나, 검색을 할 수 있는 기능이 있다.
이러한 기능이 바로 OCR(광학문자인식)을 이용한 것이다.
사람이 봤을 때 문자를 인식하는 것은 당연한 거지만, 기계가 이를 수행하기 위해선, 사실상 A.I.(인공지능)을 이용해야만 한다.

그리고 가장 많이 쓰이는 ocr 엔진중의 하나가 바로 'Tesseract' 이다.

https://github.com/tesseract-ocr/tesseract

위 주소는 Tesseract의 공식 Repository이다.

위를 참고해 Tesseract를 설치한 후.

python에서 Tesseract를 사용하기 위해서는 pytesseract와 pillow를 설치해야 한다.

cmd창에서 pip로 설치를 한다.

$pip install pillow

$pip install pytesseract

설치가 끝난후 아래의 예시를 실행시켜 보자.

from PIL import Image
from pytesseract import *

filename = 파일위치 #예시 filename = "C:/Users/lenovo/downloads/ocr/sample.jpg"
image = Image.open(filename)
text = image_to_string(image, lang="kor")

with open("sample.txt", "w") as f:
    f.write(text)

위의 코드를 ocr_tesseract.py로 저장 후 실행시키면 sample.txt로 결과가 생성된다.

Min Jae Cho

A.I. Engineer

이전 포스트

Spiking Neural Network(SNN)이란?

다음 포스트

LLM이란?

1개의 댓글

happy

2023년 8월 14일

개발자로서 성장하는 데 큰 도움이 된 글이었습니다. 감사합니다.

답글 달기