데이터 분석가에게 시각화란?
Python에서 바로 그래프를 그릴 수 있는 내장 함수
# 기본 그래프 그리기
df2.groupby('Gender')['Customer ID'].count().plot.bar()
# 컬러 지정
df2.groupby('Gender')['Customer ID'].count().plot.bar(color=['yellow','purple'])
```
시각화에 유용한 라이브러리
Matplotlib
Python에서 가장 많이 쓰는 라이브러리
라인, 바, 산점도, 히스토그램, 파이 차트 등 지원
제목, 레이블, 색상 지원
그래프를 PNG, PDF, SVG 등의 형식으로 저장 지원
seaborn
matplotlib 기반의 시각화 라이브러리
통계 그래픽을 그리기 위한 고급 인터페이스를 제공
라인, 바, 산점도, 히스토그램, 박스, 커널 밀도, 조인트, 관계, 히트맵 등 지원
Altair
Python에서 사용되는 선언적인 통계 데이터 시각화 라이브러리
문법이 간단하다는 특징을 가지고 있음
인터렉티브 그래프 지원
필수요소 - 데이터, 마크, 인코딩, 인터렉티브 여부(기본값 off)
추가요소 - 트랜스폼, 결합, 스케일, 가이드
PyGWalker
Kanaries에서 개발한 태블로 스타일의 파이썬 패키지
Pandas/Polars/Modin 데이터 프레임을 지원
Python 코드 없이 데이터 시각화 가능
바, 박스, 라인, 산점도와 같이 기본적인 시각화 가능
data load 후 드래그 앤 드랍으로 간단하게 EDA 가능
Streamlit 웹 프레임워크와 호환성이 좋음
plotly
약 40가지의 차트가 내장되어 있는 라이브러리
다양한 소프트웨어와 호환성이 좋다는 특징이 있음
인터렉티브 그래프 지원
2. seaborn
3. Altair
1. pygWalker - 편리한 EDA