데이터 시각화

kimx1201·2021년 1월 16일
0

TIC : Today I Confused

목록 보기
4/10

matplotlib, seaborn

시각화의 목적

비 시각화 방법들로 얻지 못하는 인사이트를 얻을 수 있다.

시각화의 단계

누구에게 말할 것인지 → 어떤 내용을 말할 건지 → 어떤 차트를 사용할 건지 → 데이터 변환(선택) → 프로토타입 만들기(어떤 툴을 사용할 것인지? 어떤 라이브러리를 사용할 것인지 결정) → 한글이 깨지는지, 색상이 괜찮은지, 인터렉티브를 넣을 것인지 확인

목적에 따른 시각화의 예시
분포 : Pie, Dount, Treemap, Stacked bar
관계 : Scatter, Bubble, Hist — Bar
비교 : Heatmap, Parallel coordinates, Chernoff face
시간 : Line, Connected Scatter
공간 : Map

Visual-vocabulary

group by

ex) 도시 별 가격 평균을 구하고 싶으면 group by를 사용한다.

df.groupby(‘city’).mean()

도시별 자동차 평균을 구한다면

df.groupby([‘city’, ‘cars’]).mean()

그룹바이를 사용하면 그룹 라벨이 index가 된다. 인덱스를 사용하고 싶다면 as_index=False 를 설정한다.

df.groupby([‘city’, ‘cars’], as_index=False).mean()
profile
Lifelong learner, dreamy data analyst, cat lover and enthusiastic runner :)

0개의 댓글