
4주의 여정 끝에 부스트코스가 끝났다!!🎉🎉🎉🎉🎉🎉
4주가 긴 시간일 줄 알았는데 진짜 눈 깜빡하니 끝나버렸다ㅋㅋ
어쨌든 무사히 수료까지 했으니 마지막으로 정리하면서 잘 마무리해야겠다 :D
4주차 공부 내용
- 데이터 전처리
- 데이터 시각화
- heatmap 표현
열에 있는 데이터를 행으로 옮길 때 사용
df = df_raw.melt(id_vars=["국가(대륙)별", "상품군별", "판매유형별"], var_name="기간", value_name="백만원")

df["연도"] = df["기간"].map(lambda x : int(x.split(".")[0]))

df["분기"] = df["기간"].map(lambda x : int(x.split(".")[1].split("/")[0]))

df["백만원"] = df["백만원"].replace("-", np.NaN).astype(float)

df_total = df[df["판매유형별"] == "계"].copy()
sns.lineplot(data=df_total, x="연도", y="백만원", hue="상품군별")
plt.legend(bbox_to_anchor=(1.05, 1), loc=2, borderaxespad=0.)

위 사진처럼 아래에 겹친 데이터들은 제대로 확인하기 힘들 때 사용한다.
sns.relplot(data=df_total, x="연도", y="백만원", hue="상품군별", kind="line", col="상품군별", col_wrap=4)

result = df_fashion.pivot_table(index="국가(대륙)별", columns="연도", values="백만원", aggfunc="sum")
plt.figure(figsize=(10, 6))
sns.heatmap(result, cmap="Blues_r", annot=True, fmt=".0f")

중국에서 구매액이 가장 많고 미국, 일본에서 구매액이 증가하고 있다는 사실을 알 수 있다!!
이렇게 해서 드디어 정리까지 모두 끝났다..!!!!
4주차에서도 되게 많은 시각화 실습을 했는데 겹치는 내용이 많아서 적당히 몇개만 뽑아서 정리했다ヾ(^▽^*)))
우리 2조 팀원들만이 아니라 다른 동아리 분들에게도 도움이 될 수 있길 바란다 :D