import seaborn as sns
sns.displot(df_amount, rug = True)
# 분포를 보여주는 plot
# "dist"ribution plot
# rug : Whether to draw a rugplot on the support axis : 작은 선 하나하나가 하나의 data
# rugplot : 그래프 상에서 x축 위의 작은 선분으로 실제 데이터의 위치를 나타내준 것 (False로 지정하여 차이를 확인)
Kernel-density (커널이라는 함수를 활용해 추정한 확률밀도함수를 겹쳐 그려주는 방법으로 히스토그램보다 부드러운 형태의 분포 곡선을 보여줌
상세 설명 @ https://j.mp/35TVL12)
- 꼬리가 너무 긴 형태의 분포 -> 이상치가 분포를 제대로 확인하는 것을 방해하고 있을 수 있음
- 등고선의 형태로 이상치 탐지 가능
sns.jointplot(x="amount", y="count", data=df, kind="kde")