Overview를 보면 이 competition의 모델 설계를 어떤 방향으로 가야하는지를 정할 수 있다.
Kaggle의 Jigsaw Unintended Bias in Toxicity Classification 대회가 좋은 예시가 된다.
대회 overview를 보면 conversation ai 팀이 대화 감지 모델을 만들 떄 training data에서는 gay라는 단어가 안 좋은 쪽으로 쓰인 일이 많아 Toxic으로 분류하곤 하는데, 실제로는 그렇지 않은 문장에서도 단지 gay라는 단어가 들어갔다는 이유만으로 toxic으로 분류하는 상황이 된다는 것이다.
이처럼 overview를 보면 모델의 방향성을 결정할 수 있다.
"내가 지금 풀어야 할 문제가 무엇인가?"
"이 문제의 Input과 Output은 무엇인가?"
"이 솔루션은 어디서 어떻게 사용되어지는가?"
File 형태, Metadata FieldU소개 및 설명 "데이터 스펙 요약본"