P1_Week_1_Day_1

유영재·2021년 8월 23일

부스트캠프 AI_Tech

목록 보기
11/30
post-thumbnail

P1_마스크 착용 상태 분류

대회 개요

COVID-19의 확산으로 우리나라는 물론 전 세계 사람들은 경제적, 생산적인 활동에 많은 제약을 가지게 되었습니다. 우리나라는 COVID-19 확산 방지를 위해 사회적 거리 두기를 단계적으로 시행하는 등의 많은 노력을 하고 있습니다. 과거 높은 사망률을 가진 사스(SARS)나 에볼라(Ebola)와는 달리 COVID-19의 치사율은 오히려 비교적 낮은 편에 속합니다. 그럼에도 불구하고, 이렇게 오랜 기간 동안 우리를 괴롭히고 있는 근본적인 이유는 바로 COVID-19의 강력한 전염력 때문입니다.

감염자의 입, 호흡기로부터 나오는 비말, 침 등으로 인해 다른 사람에게 쉽게 전파가 될 수 있기 때문에 감염 확산 방지를 위해 무엇보다 중요한 것은 모든 사람이 마스크로 코와 입을 가려서 혹시 모를 감염자로부터의 전파 경로를 원천 차단하는 것입니다. 이를 위해 공공 장소에 있는 사람들은 반드시 마스크를 착용해야 할 필요가 있으며, 무엇 보다도 코와 입을 완전히 가릴 수 있도록 올바르게 착용하는 것이 중요합니다. 하지만 넓은 공공장소에서 모든 사람들의 올바른 마스크 착용 상태를 검사하기 위해서는 추가적인 인적자원이 필요할 것입니다.

따라서, 우리는 카메라로 비춰진 사람 얼굴 이미지 만으로 이 사람이 마스크를 쓰고 있는지, 쓰지 않았는지, 정확히 쓴 것이 맞는지 자동으로 가려낼 수 있는 시스템이 필요합니다. 이 시스템이 공공장소 입구에 갖춰져 있다면 적은 인적자원으로도 충분히 검사가 가능할 것입니다.

데이터 개요

마스크를 착용하는 건 COIVD-19의 확산을 방지하는데 중요한 역할을 합니다. 제공되는 이 데이터셋은 사람이 마스크를 착용하였는지 판별하는 모델을 학습할 수 있게 해줍니다. 모든 데이터셋은 아시아인 남녀로 구성되어 있고 나이는 20대부터 70대까지 다양하게 분포하고 있습니다. 간략한 통계는 다음과 같습니다.

  • 전체 사람 명 수 : 4,500

  • 한 사람당 사진의 개수: 7장 [마스크 착용 5장, 이상하게 착용(ex. 코스크, 턱스크) 1장, 미착용 1장]

  • 이미지 크기: (384, 512)

전체 데이터셋 중에서 60%는 학습 데이터셋으로 활용됩니다.

결과값은 총 18개의 class를 예측해야합니다. 결과값으로 0~17에 해당되는 숫자가 각 이미지 당 하나씩 나와야합니다.

  • Class Description

Today's Wrap-up

- 오늘 프로젝트에서 목표는 무엇이었는가?

  1. EDA 수행하며 데이터 분석하기
  2. 첫 제출하기
  3. 서버 환경 구축하기

- 오늘 나는 어떤 방식으로 모델을 개선했는가?

  1. Backbone 모델 탐색
  2. Dataset 구축

- 오늘 내가 한 행동의 결과로 어떤 지점을 달성하고, 어떠한 깨달음을 얻었는가?

  1. 이미지 데이터를 제대로 다뤄본 경험이 없었기 때문에 다른 이미지 대회 관련 자료들을 찾아보며 접근 방법을 고민하였고, 이미지 역시 텍스트처럼 전처리가 중요하다는 느낌을 받았다.
  2. 클래스가 imbalance 한데, 텍스트와 달리 image는 다양한 augmentation 기법들이 라이브러리화 되어있으니 적용해 봐야겠다.

- 느낀점

지금까지 제대로 서버를 사용해본 적이 없었는데(코랩 밖에 몰랐던 나란 인간...) 처음으로 V100 서버를 받아 환경을 구축했다.
EDA가 과제로 주어졌고 필수과제

0개의 댓글