최종 프로젝트 첫째주...
저번주부터 최종 프로젝트가 시작하기 전에 마음이 맞는 팀원들이 생겼다.
그렇게 우리는 프로젝트가 시작하기 전부터 어떤 주제로 어떤 분석을 해볼지 고민들을 한거 같다. 그리고 실제 회사에서 사용하는 데이터가 사용해보고 싶었던 우리는 생각하던 것을 실현해보기로 했다.
감사하게도 한 기업에서 연락을 주셨고, 그렇게 컨택을 이어갔다.
그런데... 보안상의 이슈와 포트폴리오에 사용하는 것에 리스크가 있을 것으로 피드백을 받고 아쉽지만 데이터 셋을 변경하기로 햇다.
그렇게 어떤 데이터를 사용할지 찾아보다가 괜찮아보이는 이커머스 데이터 중 하나를 찾게되었다. 아마존 데이터였다.
그렇게 무엇을 어떻게 분석을 해야하는지. 팀원들과 이야기를 했다.
진행방향을 확인하고 분석 지표를 공부해보고 다시 분석 목적 및 방향을 확인하게 되고 하면서도 하려는 도메인에 대한 공부와 분석방법에 대한 공부가 필요해서 공부를 다같이 했다. 공부가 끝나고 가설 설정 및 정의들을 내려봤다. 모호한 것들에 대한 정의도 논의를 걸쳐서 우리의 기준으로 정확하게 정의를 내렸다.
그리고 컬럼들을 보면서 어떤 의미인지 확인하고 가설을 검증하고 EDA를 하면서 이상치들과 결측치들을 어떻게 처리할지를 논의하고 여러가지 방법으로 확인했다.
같이 함께 하면서 많은 것들을 배우게 된다. 아 어떻게 깊게 생각을 해야하는지. 그래프들을 보면 그래프의 설명인지 가설을 설명하는 것인지를 조금 더 배우게 된거같다.
팀원들 모두가 다 이해하는지 확인하고 지나가는 것도 너무 좋다. 그래도 가끔은.. 나도 모르게 흘려보낸것들이 있다. 그래서 주말에는 프로젝트 복습을 해야겠다고 느꼈다.
이번 프로젝트땐 많은 것들을 배우고 끝낼수 있을꺼 같다.