대시보드 + 배송 예측 모델은 어떻게 정리되어가고 있는 것 같은데... 뭐랄까... 내용이 너무 부족하다.
그래서 이제 2명이 피그마(디자인) 하는 동안 나머지 3명은 외부 데이터 더 찾아보거나 EDA를 좀 더 해보기로 했다.
그런데 튜터님께 이 말씀을 드리니까 일단은 그동안 EDA 했던 내용들부터 정리하는 게 좋을 것 같다고 하셨음. (매우 동감합니다.)
팀원들끼리도 서로가 한 것들에 대해 완전히 파악한 건 아니어서 한번 내용을 정리하고, 그 다음 아이디어를 생각하는 게 맞는 것 같다.
그래서 일단 내일 내용 정리부터 하고, 데이터를 더 들여다보거나 외부데이터를 찾아보거나 해야할 것 같다.


알리익스프레스에서는 웬일인지 올리스트가 휴가중이었지만,,
브라질 주요 마켓플레이스인 Mercado Livre, Amazon 등에서 현재 Olist가 실제로 판매중인 상품들에 대한 데이터를 끌어와 분석하는 건 어떨까?!
....라는 생각을 했었다.
근데 일단 우리 데이터가 2016~2018년 데이터이고, product id도 달라서 연결을 짓는 건 불가능하고..
아마 가져온다면 따로 빼서 써야할 것 같은데....
흠.. 잘 연결 지을 수 있을지 모르겠다.
근데 리뷰, 주문수, 재고, 배송예상일 등등 정보가 꽤나 많아서 아깝긴 하다ㅜㅜ
물류 창고 위치 데이터만 찾아낸다면 클러스터링을 하든 배송 경로 시각화를 하든 할 수 있을텐데ㅜㅜ

아무리 뒤져도 알 수 있는건 서비스 지역 리스트가 최선이다..
일단 이거라도 맵으로 시각화해서 쓸만한지 확인해봐야겠다.
우리 데이터에 위치에 대한 정보가 많아서 잘만 활용한다면 참 많은 걸 할 수 있을텐데..
물류 창고의 정확한 위치는 몰라도 도시 단위까지는 알 수 있으니까 일단 희망은 갖는 중ㅎㅎ
...라는 의견이 나와서 뭘 더 볼 수 있을지 고민해봤다.
일단 나는 "행사 기간" <- 이 주제에 꽂혔다.
데이터에서 블랙프라이데이에 매출이 급상승한 걸 확인했었는데, 이 내용을 그냥 넘어갔더랬음.

브라질의 공휴일, 기념일을 더 찾아서 이런 특별한 날이 있는 시기의 매출도 분석을 해보면 좋을 것 같다는 생각이 들었다.
유의미한 차이가 있을런지는 아직도 모르겠지만,,
만약에 유의미한 차이를 발견한다면 다음 기념일을 대비한 마케팅 액션 플랜으로 연결지을 수 있지 않을까.....?
지금 내용에 통계적인 분석이 너무 없는 것 같아서,, 통계적 가설검정 같은 걸 넣어야하진 않을까 고민된다.
예를 들면 이런 것들..........??
근데 우리가 만든 대시보드랑 내용이 이어져야 좋으니까 이 부분도 좀 더 고민해봐야겠다.