앞의 포스팅에서 Craft의 학습 과정에대해 알아 보았다.
손글씨 OCR도 진행 하고싶었지만 손글씨는 학습 방식에 맞지않는 특징들이 많아 추후에 진행 해보도록 하겠다.
clovaai에는 공개된 데이터 SynthText, IC13, IC17을 통해 학습한 기본 모델을 제공해 주고있다. 우선 3가지 전부 테스트 해 보았는데 General model의 성능이 가장 좋아보였다.
해당 모델은 Craft👈에서 다운 받을 수 있다.
clovaai의 오픈소스와 모델을 다운 받았으면 테스트를 진행할 수 있다.
python test.py --trained_model=path/to/your/model/folder/model_name.pth --test_folder=path/to/your/data/folder/
글자가 있는 이미지를 넣어 테스트 해보겠다
👉Region Box (res_test_img.jpg)
👉Mask (res_test_img_mask.jpg)
👉Region (res_test_img.txt)
11,35,68,35,68,58,11,58
71,35,111,35,111,58,71,58
114,37,172,37,172,58,114,58
342,53,400,53,400,70,342,70
...
위와 같이 3가지 결과 파일이 Output으로 나온다. 앞의 포스팅을 보면 Mask Map이 왜 저렇게 나오는지 이해하기 쉬울것이다.
글자가 많고 촘촘하게 있어도 좋은 결과를 내고있는 General Model의 결과를 볼 수 있다.
이미지 출처 : https://blog.naver.com/PostView.naver?blogId=typrinter&logNo=221106389288