Python 프로그래밍 언어 및 수학적 확장 NumPy 라이브러리를 활용한 플로팅 라이브러리이다.
시각화 : 많은 양의 자료를 시각화를 통해 전체적인 분포, 패턴, 인사이트를 확인 가능
matplotlib 라이브러리를 이용 - seaborn이 추가적인 지원
import numpy as np
# matplotlib 라이브러리 사용
import matplotlib.pyplot as plt
# 한글을 안깨지도록 글꼴을 저장 (필수)
plt.rc('font', family='malgun gothic') # 한글깨짐 방지
plt.rcParams['axes.unicode_minus'] = False # 음수 부호 깨짐 해결
# 한글로 시각화 하려면 해당 위의 2개의 명령어는 필수이다.
# x 축에 한글로 값을 주었지만 실제 데이터는 0,1,2 이다.
x = ['서울','인천','수원']
y = [5,3,7]
plt.plot(x, y)
plt.show()
위와 같이 데이터를 시각화하여 볼 수 있게 해준다.
matplotlib에는 다양한 메소드들이 있다.
xlim()는 x축, ylim()은 y축, 그래프 축의 범위를 설정할 수 있다.
x = [0,1,2]
y = [5,3,7]
# 다른 축을 따로 정의하지 않았을 경우 정의된 축의 구간 값을 따라간다.
# xlim(), ylim() 으로 x, y축 각각 한계 치 값을 늘릴 수 있다.
plt.xlim([-1, 3])
plt.ylim([0,10])
plt.plot(x, y)
plt.show()
xlabel(), ylabel() 함수를 사용하면 그래프의 x, y 축에 대한 레이블을 표시할 수 있다.
# xlable(), ylabel() 로 라벨 설정
plt.xlabel('지역')
plt.ylabel('숫자')
말 그대로 제목을 설정 해준다.
틱 (Tick)은 그래프의 축에 간격을 구분하기 위해 표시하는 눈금입니다.
xticks(), yticks() 함수는 각각 X축, Y축에 눈금을 표시합니다.
plt.title('제목') # 제목 설정
plt.yticks(list(range(0,10,3))) # y축에 눈금표시
기존 y축의 눈금표시가 달라진 것을 확인할 수 있다.
산점도 (Scatter plot)는 두 변수의 상관 관계를 직교 좌표계의 평면에 점으로 표현하는 그래프입니다.
matplotlib.pyplot 모듈의 scatter() 함수를 이용하면 산점도를 그릴 수 있습니다.
x = np.arange(0,3 * np.pi,0.1)
y_cos = np.cos(x)
plt.scatter(x, y_cos)
plt.xlabel('x축')
plt.ylabel('y축')
plt.legend(['cosine'])
plt.show()