파이썬 기반 데이터 분석 환경에서 가장 일반적으로 사용되는 시각화 라이브러리
하위 라이브러리인 'pyplot'을 통해 주요 기능을 사용
plotly, seaborn 등과 같은 라이브러리가 최근 경쟁력을 갖추고 있음
pandas 객체의 기본적인 시각화 도구
plot() 메서드를 통해 데이터를 시각화
종류
라이브러리 가져오기
축 이름과 plot 제목 지정
선 두개 그려보기
범례 추가하기
plt.plot([x], y, [fmt], **kwargs)
- fmt : '[color][marker][line]'
- 색상, 마커, 선 등에 대한 포맷 옵션 설정
1) 마커 참조 도큐먼트 주소
https://matplotlib.org/3.1.3/api/markers_api.html
2) 색상 참조 도큐먼트 주소
https://matplotlib.org/3.1.0/gallery/color/named_colors.html
3) 라인 스타일 참조 도큐먼트 주소
https://matplotlib.org/gallery/lines_bars_and_markers/line_styles_reference.html
스타일 문자열 추가 : [fmt] => color + maker + line 순서대로 문자열 작성
기타 스타일 파라미터 종류
plt.xlim(min, max)
plt.ylim(min, max)
자료값에 비해 큰 플롯을 지정한 경우
자료값에 비해 지나치게 작은 플롯을 구성할 경우 일부 플롯이 잘려나간다.
grid 표시하기
대표값을 중심으로 데이터가 흩어져 있는 정도를 시각화
데이터의 분산 정도, 데이터 간의 상관관계를 파악할 수 있음
plt.scatter(x, y, s=None, c=None, data=None)
정규분포 확률밀도에서 100개의 표본 추출
여러 값의 상대적인 크기를 비교하기에 적합한 표현법이며 원형 차트보다 더욱 일반적으로 사용됨
plt.bar(x, y)
범주형 데이터에 대한 bar graph 기본