1) νλ³Έμ΄ μλ‘ λ
립μ μ΄μ¬μΌ νλ€.
2) νλ³Έμ΄ μ κ·λΆν¬λ₯Ό μ΄λ€μΌ νλ€.
from scipy.stats import normaltest
import numpy as np
sample = np.random.normaal(size = 1000) # normal λΆν¬κ° μλ
normaltest(sample)
3) λΉκ΅νλ λ νλ³Έμ λΆμ°μ΄ ν΅κ³μ μΌλ‘ μ μ¬ν΄μΌνλ€. (p > 0.05)
1) Categorical λ°μ΄ν°μ μ ν©ν λͺ¨λΈλ§μ΄ κ°λ₯ν¨
2) κ·Ήλ¨μ outlierκ° μλ κ²½μ°μλ μ¬μ©ν μ μμ
3) distribution free methodλΌκ³ λ λΆλ¦
κ·λ¬΄κ°μ€ : λ°μ΄ν°κ° μμλλ λΆν¬μ μ μ¬ν λΆν¬λ₯Ό 그릴 κ²μ΄λ€.
λ립κ°μ€ : λ°μ΄ν°κ° μμλλ λΆν¬μ μ μ¬νμ§ μμ κ²μ΄λ€.
μμλλ λΆν¬λ λκ° λ°μ΄ν°μ νκ· μ μ¬μ©ν¨
π2 = β(πππ πππ£ππiβππ₯ππππ‘πππ)^2 / (ππ₯ππππ‘πππ)
ns_obs = np.array([[5, 23, 26, 19, 24, 23]])
import numpy as np
from scipy.stats import chisquare
chisquare(a, axis=None)
ex1) λ§μ€ν¬ μ°©μ© μ¬λΆμ μ½λ‘λ19 κ°μΌ μ¬λΆ
ex2) νΌμΈ μ¬λΆμ λ°λ₯Έ μ¬κ° λΉμ©
from scipy.stats import chi2_contingency
a= pd.crosstab(customer['marriage'], customer['consum_alchol'])
print(chi2_contingency(a)