강의 내용
말곤 무엇을 했나요?
Annotation을 직접 하는 과정이 상당히 번거로웠다. 부스트캠프 측에서 Annotation guide를 주고 그것대로 하면 됐지만, 잘 하기에는 여러 부족한 점이 많았다.
우선 Guide를 외우고 있지 않아 헷갈리는 상황마다 guide를 찾아봐야 했고, guide에 나와있는 내용이지만 뭔가 적용하기 애매한 것들이 있었다. 예를 들어 어떤 단어가 이미지에 있어 Annotation을 해야하는데, 글자 간격이 애매하게 벌어져 있어 연결된 단어로 봐야할지 한 글자씩 봐야 할 지 헷갈리는 경우가 생겼다.
또 이미지 내에 글자 수가 엄청나게 많은 경우 이를 일일이 Annotation 해주는 것은 정말 고된 일이었다. 단순히 노가다 작업이라 시간과 정성을 들여야만 높은 퀄리티의 데이터가 나올 수 있었다. 이 실습을 통해 왜 Annotation이 어려운지 몸으로 체험할 수 있었고, 데이터 라벨링을 하는 분들도 꽤나 힘들겠구나 하는 생각을 하게 되었다.