데이터 종류를 결정하는데 있어서 오랜 시간이 들었다. 한국 데이터를 사용하고 싶었지만 kaggle로는 한계가 있었다..🥲 결국 데이터셋을 결정하고 이를 어떻게 활용할 것인지에 관해 논의해보았다. 엘리스에서는 단순히 데이터를 분석하고 이를 시각화하여 웹 서비스에 더 초점을 두는 것을 권장했다. 그래서 우리 팀은 데이터의 키워드를 카테고리화하여 중복 선택하는 것을 제외하고, 정렬하는 방식을 채택했다. 중복 선택을 가능하게 하려면 모델링을 해야하는데, 이는 아무래도 시간을 많이 잡아먹을거 같다..
데이터를 어떻게 활용할 지 많이 고민한게 보여요! 👏