π¦π¦
νκ·μμ Accuracyλ₯Ό μ¬μ©νμ§ μλ μ΄μ ? -> μμΈ‘νλ λ³μκ° μ°μνμ΄κΈ° λλ¬Έμ μμμ λμ리κΉμ§ μ ννκ² μμΈ‘νκΈ° μ΄λ €μμ
MAE(Mean Absolute Error) : μ€μ°¨μ λν μ λκ° νκ·
MSE(Mean Squared Error) : λΆμ°κ³Ό μ μ¬ν 곡μμΌλ‘, μ€μ κ°κ³Ό μμΈ‘κ°λ€μ΄ μΌλ§λ λ¨μ΄μ Έ μλμ§ νλ¨νκ³ μ ν¨
RMSE(Root Mean Squared Error) : νμ€νΈμ°¨μ μ μ¬ν 곡μ. κ°μ΄ λ무 컀μ§λ κ²μ λ°©μ§νκΈ° μν΄ μ κ³±κ·Όμ μ·¨ν¨
μ μ§κ΄μ μΈ MAE λ§κ³ RMSEλ₯Ό μ°μλμ?
https://data101.oopy.io/mae-vs-rmse
display
: Ipython νκ²½μ λͺ
λ Ήμ΄. μ½λλΈλ μ€κ°μ μλ μ½λλ₯Ό μΆλ ₯νκ³ μΆμ λ μ¬μ©
train_test_split()
plt.subplots()
fig, axes λ³μμ λ΄μμ μ¬μ©
κ·Έλνλ₯Ό κ·Έλ¦¬κ³ μΆ μ§μ
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(12,4))
sns.countplot(x=y_train, ax=axes[0]).set_title("train")
sns.countplot(x=y_test, ax=axes[1]).set_title("test")
grid searchμ random search
grid search : μ§μ λ ꡬκ°μ λν κ°μ λν΄ νμ
GridSearchCV()
μ§μ λ κ΅¬κ° μΈμ μ΅μ κ°μ΄ μμ λ μ°Ύμ§ λͺ»νλ λ¨μ μ΄ μμ
μ§μ λ νλΌλ―Έν°μ μ‘°ν©μ μ λ§νΌ μ€ν
random search : 그리λμμΉμ λ¨μ μ 보μν΄ μ§μ λ νμ λ΄μμ λλ€ν κ°λ€μ ν΅ν΄ μ±λ₯μ νκ°νκ³ κ·Έ μ€ κ°μ₯ μ’μ μ±λ₯μ λ΄λ νλΌλ―Έν°λ₯Ό μ°Ύμ
μ’μ μ±λ₯μ λ΄λ ꡬκ°μΌλ‘ μ μ μ’νκ°λ©° νμ
RandomizedSearchCV()
k-fold μ * n_iter μ λ§νΌ μ€ν
κ° ν¨μ μ μ© ν fit μ μ©ν΄μΌ ν¨
classification_report
: νκ° μ§νμ λν λ μμΈν report μΆλ ₯