[Boostcamp AI Tech] [데이터 제작] 15주차 Day 2 학습 기록

bluegun·2021년 11월 11일
0

AI Tech 2기 활동

목록 보기
69/87

요약

강의 내용

  • OCR, Text Detection 이론 및 EAST 모델 소개
  • Annotation 강의 및 실습

말곤 무엇을 했나요?

  • 직접 OCR Annotation 실습을 함 -> 생각보다 Annotation 규칙을 적용하기 어렵고 번거롭고 귀찮다.

Annotation을 직접 하는 과정이 상당히 번거로웠다. 부스트캠프 측에서 Annotation guide를 주고 그것대로 하면 됐지만, 잘 하기에는 여러 부족한 점이 많았다.
우선 Guide를 외우고 있지 않아 헷갈리는 상황마다 guide를 찾아봐야 했고, guide에 나와있는 내용이지만 뭔가 적용하기 애매한 것들이 있었다. 예를 들어 어떤 단어가 이미지에 있어 Annotation을 해야하는데, 글자 간격이 애매하게 벌어져 있어 연결된 단어로 봐야할지 한 글자씩 봐야 할 지 헷갈리는 경우가 생겼다.
또 이미지 내에 글자 수가 엄청나게 많은 경우 이를 일일이 Annotation 해주는 것은 정말 고된 일이었다. 단순히 노가다 작업이라 시간과 정성을 들여야만 높은 퀄리티의 데이터가 나올 수 있었다. 이 실습을 통해 왜 Annotation이 어려운지 몸으로 체험할 수 있었고, 데이터 라벨링을 하는 분들도 꽤나 힘들겠구나 하는 생각을 하게 되었다.

0개의 댓글