210914 EXPLORATION 18. OCR

시에나 Sienna·2021년 9월 17일

AIFFEL EXPLORATION

0

AIFFEL

목록 보기

46/66

post-custom-banner

OCR(Optical Character Recognition, 광학 문자 인식)

문자 인식 과정
1. 사진 속 문자의 위치 탐색 ⇨ Text Detection(문자검출)
2. 찾은 문자영역에서 문자를 읽어냄 ⇨ Text Recognition(문자인식)
OCR 테스트에서 사용하는 데이터셋 : LeNet
- LeNet : 간단한 구조로도 어려운 글자를 읽을 수 있는 딥러닝 분류 모델
구조

LeNet의 MNIST 데모 이미지	Yann LeCun's Demo	Robustness to Noise

강건성(robustness)이란?
- 머신러닝에서 구축한 모델을 조금 바꾸거나 입력으로 사용하는 데이터를 살짝 바꿔도 해석과 예측이 크게 변하지 않는 성질
Object Detection(객체 인식) : 사진 속 문자를 찾아내는 딥러닝 모델 중 하나

(번외)딥러닝 기반 객체 검출 방법

Regression(회귀) 방식 : 기준으로 하는 박스 대비 문자의 박스가 얼마나 차이가 나는지를 학습

Segmentation(세그멘테이션) 방식 : 픽셀 단위로 해당 픽셀이 문자를 표현하는지를 분류하는 문제(pixel-wise classification)

자연어처리 - RNN
이미지내 문자 인식 모델 - CNN + RNN = CRNN

CNN : 이미지 내의 텍스트와 연관된 특징을 추출
RNN : 스텝 단위의 문자 정보를 인시

실습결과

시에나 Sienna

이전 포스트

210909 EXPLORATION 17. KorQuAD

다음 포스트

210916 EXPLORATION 19. cGAN

post-custom-banner

0개의 댓글