samples = [1, 7, 9, 16, 36, 39, 45, 45, 46, 48, 51, 100, 101]
tmp_y = [1]*len(samples)
tmp_y
import matplotlib.pyplot as plt
plt.figure(figsize=(12, 4))
plt.scatter(samples, tmp_y)
plt.grid()
plt.show()
import numpy as np
print('median : ', np.median(samples))
print('Q1 : ', np.percentile(samples, 25))
print('Q3 : ', np.percentile(samples, 75))
print('IQR : ', np.percentile(samples, 75) - np.percentile(samples, 25))
IQR = np.percentile(samples, 75) - np.percentile(samples, 25)
print('IQR*1.5 : ', IQR*1.5)
q1 = np.percentile(samples, 25)
q2 = np.median(samples)
q3 = np.percentile(samples, 75)
upper_fence = q3 + IQR*1.5
lower_fence = q1 + IQR*1.5
plt.figure(figsize=(12, 4))
plt.scatter(samples, tmp_y)
plt.axvline(x=q1, color='black')
plt.axvline(x=q2, color='red')
plt.axvline(x=q3, color='black')
plt.axvline(x=upper_fence, color='black', ls='dashed')
plt.axvline(x=lower_fence, color='black', ls='dashed')
plt.grid()
plt.show()
import seaborn as sns
plt.figure(figsize=(12, 4))
sns.boxplot(samples)
plt.grid()
plt.show()
"이 글은 제로베이스 데이터 취업 스쿨 강의를 듣고 작성한 내용으로 제로베이스 데이터 취업 스쿨 강의 자료 일부를 발췌한 내용이 포함되어 있습니다."