210914 EXPLORATION 18. OCR

시에나 Sienna·2021년 9월 17일
0

AIFFEL

목록 보기
46/66
post-custom-banner

OCR(Optical Character Recognition, 광학 문자 인식)

  • 문자 인식 과정

    1. 사진 속 문자의 위치 탐색 ⇨ Text Detection(문자검출)
    2. 찾은 문자영역에서 문자를 읽어냄 ⇨ Text Recognition(문자인식)
  • OCR 테스트에서 사용하는 데이터셋 : LeNet

    • LeNet : 간단한 구조로도 어려운 글자를 읽을 수 있는 딥러닝 분류 모델
  • 구조

LeNet의 MNIST 데모 이미지Yann LeCun's DemoRobustness to Noise
  • 강건성(robustness)이란?

    • 머신러닝에서 구축한 모델을 조금 바꾸거나 입력으로 사용하는 데이터를 살짝 바꿔도 해석과 예측이 크게 변하지 않는 성질
  • Object Detection(객체 인식) : 사진 속 문자를 찾아내는 딥러닝 모델 중 하나

(번외)딥러닝 기반 객체 검출 방법

  • Regression(회귀) 방식 : 기준으로 하는 박스 대비 문자의 박스가 얼마나 차이가 나는지를 학습
  • Segmentation(세그멘테이션) 방식 : 픽셀 단위로 해당 픽셀이 문자를 표현하는지를 분류하는 문제(pixel-wise classification)

자연어처리 - RNN
이미지내 문자 인식 모델 - CNN + RNN = CRNN

  • CNN : 이미지 내의 텍스트와 연관된 특징을 추출
  • RNN : 스텝 단위의 문자 정보를 인시

실습결과

post-custom-banner

0개의 댓글