QQ 플롯의 QQ는 Quantile-Quantile인데, 이는 '분위'를 뜻한다.
수집된 데이터를 표준정규분포의 분위수와 비교하여 그리는 그래프이다.
통계 추론은 대부분이 모집단이 정규분포를 따른다는 것을 전제로 하는데, 이 QQ 플롯은 정규분포 가정을 하는 데 용이하다.
데이터가 정규분포를 따르면 아래와 같이 직선의 형태로 플롯이 그려지게 된다.
import matplotlib.pyplot as plt
import scipy as sp
fig, ax = plt.subplots(figsize=(8, 6))
norm_sample = sp.stats.norm.rvs(size=100)
sp.stats.probplot(norm_sample, plot=ax)
plt.show()
sp.stats.norm.rvs는 정규분포 안의 난수를 생성하는 함수이다.
따라서 데이터는 전반적으로 정규분포를 따를 것이기에 위와 같은 그래프가 그려지게 된다.