
적절한 그래프 유형 선택과 옵션 활용이 중요
Visual Explanation vs Text Explanation
- Anscombe 예제: 기술 통계 vs 데이터 시각화
figure: 도화지 (그림전체)
axes: 도화지 내 plot이 그려지는 공간
axis: plot의 축 -> x, y
| Matplotlib | Seaborn | |
|---|---|---|
| 기능 | 파이썬의 기본적인 시각화 라이브러리 | 통계 시각화에 특화 |
| 디스플레이 | 기본적이고 단순한 디스플레이 | 다채로운 시각화 가능 |
| 복잡도 | 한 줄의 코드로 복잡한 그래프 구현 어려움 | 쉽고 간단하게 복잡한 기능 구현 |
| 다중성 | 여러 개의 시각화 가능 | 다중 시각화 어려움(메모리 부족 이슈) |
| 유연성 | 유연한 인터페이스 제공 | 유연성이 상대적으로 떨어짐 |
pyplot 모듈을 많이 사용, 주로 plt라는 별칭 이용하여 호출
import matplotlib.pyplot as plt
plt.plot(기간, 변수1), plt.plot(기간, 변수2)plt.figure() # 새로운 그래프를 담을 도화지 생성
plt.plot() #데이터 시각화 기능, 그래프 유형과 변수설정 가능
plt.show() #그래프 출력
그래프 구성 요소 > pyplot을 이용하면 figure, axes, axis 쉽게 조작 가능
import matplotlib.pyplot as plt
plt.figure()
plt.plot([0,1,2,3,4,5],[0,1,2,3,4,5])
plt.title('라인 그래프')
plt.ylabel('y축')
plt.xlabel('x축')
plt.show()
Matplotlib의 pyplot 모듈에서는 subplot과 subplots 커맨드를 활용하여 여러 그래프 구현 가능
plt.subplot(row, colum, index)
하나의 ax에 두 종류 그래프, 같은 x축을 공유, 다른 y축 사용
한 줄의 코드로 강력한 시각화 가능
import seaborn as sns
간결한 한 줄 코들도 쉽고 간단하게 복잡한 기능 구현

통계 시각화에 특화 고수준 API

데이터에 적합한 다채로운 시각화 기능 제공

import seaborn as sns
sns.scatterplot(x ='변수명',
y='변수명',
hue='범주형 변수명',
data= 데이터 이름)