노이즈가 많은 실제 문서 이미지 OCR 모델 개선
https://youtu.be/pECt2rXbpTk
Text Detection의 어려운 점
노이즈에 강한 모델을 만들기 위해서 많은 양의 데이터 확보가 필수
Data Generation
모델 학습에서 필요한 Label까지 데이터 생성과정에서 해결할 수 있다.
--> Fully Supervised Learning
Data Augmentation
Label은 그대로 사용할 수 있도록
모델 학습에서 필요한 Label 중에 De-noising Label이 존재하지 않는다. 따라서 Detection Label을 통해 Weakly Supervised Learning
Multi Task Learning
기존의 detection output 외에, De-noising Output을 추가한다.
De-noising Output
Segmentation을 통해 글자, 단어와 배경을 binary하게 구분한 것
모델 학습은 자세히 이해가 가지 않는다.
모델 구조를 확인할 필요가 있을 것 같다.
현재 이해가 가지 않는 것은
multi task, 즉 원래의 detection output과
de-noising output을 출력하는 모델이 학습을
각각 output에 대해서 진행한다면 가중치 학습이 어떻게 진행되는 건지,
Real Data를 이용한 모델 학습에서 2단계 학습 중인 모델 이용 과정도 모르겠다.