이번 포스팅은 영상 입력에 관한 내용입니다.이미지(혹은 어떤 영상)는 우리 눈으로 봤을 때, 3차원의 형태로 보여지게 됩니다.어떤 자연계의 신호를 정수형태로 변환하는 과정이라 생각하면 됩니다.그림을 보면, 이미지 픽셀이 막 찍혀있는 것을 볼 수 있습니다.이 픽셀의 간격
Color Space 스펙트럼
위 그래프에서 x축 a, b 파트에서 기울기 값이 달라지는 것을 확인할 수 있습니다.그래서 명도 대비가 커지는 현상이 발생합니다.어떤 이미지 데이터를 히스토그램으로 나타낼 수 있는데, 이렇게 시각화 하면, 각 pixel(R,G,B)가 얼마나 나왔는지 바로 파악 할 수
이번 내용은 데이터 학습으로 객체 분할 하는 것이 아닌, 이미지의 각 픽셀 단위로 접근하는 객체 분할 내용입니다. Approach 활용한 이미지는 위와 같고, 육안으로는 눈이 내리는 상황으로 보입니다. 제가 원하는 분할 부위는 눈이 쌓인 구간이고, 내리는 눈 때문에 픽셀들이 깨진 부위가 자꾸 보이는데, 이건 현재 상황에서는 노이즈로 볼 수 있습니다....
이번 포스팅은 OCR 성능 높이기 위한 접근방식 정리 내용입니다.
OCR 성능 끌어올리기 위한 이미지 전처리 작업 중, 이진화(Binarization) 내용입니다.
이전 'Global thresholding' 기법에 이은 'Adaptive thresholding' 내용입니다.
이미지 이진화 이후, 노이즈 감소 내용입니다.
노이즈 제거 및 글자 복원 내용입니다.