[TIL] 22.10.31

λ¬Έμ’…ν˜„Β·2022λ…„ 10μ›” 31일
0

TIL

λͺ©λ‘ 보기
28/119
post-custom-banner

🦁🦁

πŸ‘‰ 였늘 ν•œ 일

  • μ˜μ‚¬κ²°μ •λ‚˜λ¬΄(νšŒκ·€) μ΄μ–΄μ„œ
  • νŒŒλΌλ―Έν„° νŠœλ‹

μ˜μ‚¬κ²°μ •λ‚˜λ¬΄(νšŒκ·€)

νšŒκ·€μ˜ ν‰κ°€μ§€ν‘œ

νšŒκ·€μ—μ„œ Accuracyλ₯Ό μ‚¬μš©ν•˜μ§€ μ•ŠλŠ” 이유? -> μ˜ˆμΈ‘ν•˜λŠ” λ³€μˆ˜κ°€ μ—°μ†ν˜•μ΄κΈ° λ•Œλ¬Έμ— μ†Œμˆ˜μ  λμžλ¦¬κΉŒμ§€ μ •ν™•ν•˜κ²Œ μ˜ˆμΈ‘ν•˜κΈ° μ–΄λ €μ›Œμ„œ

MAE(Mean Absolute Error) : μ˜€μ°¨μ— λŒ€ν•œ μ ˆλŒ“κ°’ 평균

  • μ˜€μ°¨μ— λŒ€ν•œ 직관적인 νŒλ‹¨ κ°€λŠ₯
    MAPE(Mean Absolute Percentage Error) : μ˜€μ°¨μ— λŒ€ν•œ μ ˆλŒ“κ°’ λΉ„μœ¨ 평균

MSE(Mean Squared Error) : λΆ„μ‚°κ³Ό μœ μ‚¬ν•œ κ³΅μ‹μœΌλ‘œ, μ‹€μ œκ°’κ³Ό μ˜ˆμΈ‘κ°’λ“€μ΄ μ–Όλ§ˆλ‚˜ λ–¨μ–΄μ Έ μžˆλŠ”μ§€ νŒλ‹¨ν•˜κ³ μž 함

  • λΆ„μ‚°κ³Ό MSE의 차이? : 뢄산은 κ΄€μΈ‘κ°’μ—μ„œ 평균을 λΊ€ 값을 제곱, MSEλŠ” μ‹€μ œκ°’μ—μ„œ μ˜ˆμΈ‘κ°’μ„ λΊ€ 값을 제곱
  • MAE에 λΉ„ν•΄ μ˜€μ°¨κ°€ 클수둝 νŒ¨λ„ν‹°λ₯Ό 더 많이 μ€€λ‹€

RMSE(Root Mean Squared Error) : ν‘œμ€€νŽΈμ°¨μ™€ μœ μ‚¬ν•œ 곡식. 값이 λ„ˆλ¬΄ μ»€μ§€λŠ” 것을 λ°©μ§€ν•˜κΈ° μœ„ν•΄ μ œκ³±κ·Όμ„ 취함

  • RMSEλŠ” MAE에 λΉ„ν•΄ 직관성은 λ–¨μ–΄μ§€μ§€λ§Œ, λ‘œλ²„μŠ€νŠΈν•œ 성격(=극단적이지 μ•Šμ€)μ—μ„œ 강점을 보인닀

μ™œ 직관적인 MAE 말고 RMSEλ₯Ό μ“°μ‹œλ‚˜μš”?
https://data101.oopy.io/mae-vs-rmse

parameter tuning

display : Ipython ν™˜κ²½μ˜ λͺ…λ Ήμ–΄. μ½”λ“œλΈ”λŸ­ 쀑간에 μžˆλŠ” μ½”λ“œλ₯Ό 좜λ ₯ν•˜κ³  싢을 λ•Œ μ‚¬μš©

train_test_split()

  • stratify : μΈ΅ν™”μΆ”μΆœ. train setκ³Ό test setλ₯Ό 뢄리할 λ•Œ, class λΉ„μœ¨μ„ λ™μΌν•˜κ²Œ 함

plt.subplots()

  • fig, axes λ³€μˆ˜μ— λ‹΄μ•„μ„œ μ‚¬μš©

    • figλŠ” 전체 도화지, axesλŠ” 각각의 μ„œλΈŒν”Œλ‘―μ„ 의미
  • κ·Έλž˜ν”„λ₯Ό 그리고 μΆ• 지정

    • e.g.
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(12,4))
sns.countplot(x=y_train, ax=axes[0]).set_title("train")
sns.countplot(x=y_test, ax=axes[1]).set_title("test")

grid search와 random search

  • grid search : μ§€μ •λœ ꡬ간에 λŒ€ν•œ 값에 λŒ€ν•΄ 탐색

    • GridSearchCV()

    • μ§€μ •λœ ꡬ간 외에 μ΅œμ κ°’μ΄ μžˆμ„ λ•Œ 찾지 λͺ»ν•˜λŠ” 단점이 있음

    • μ§€μ •λœ νŒŒλΌλ―Έν„°μ˜ μ‘°ν•©μ˜ 수 만큼 μ‹€ν–‰

  • random search : κ·Έλ¦¬λ“œμ„œμΉ˜μ˜ 단점을 보완해 μ§€μ •λœ 횟수 λ‚΄μ—μ„œ λžœλ€ν•œ 값듀을 톡해 μ„±λŠ₯을 ν‰κ°€ν•˜κ³  κ·Έ 쀑 κ°€μž₯ 쒋은 μ„±λŠ₯을 λ‚΄λŠ” νŒŒλΌλ―Έν„°λ₯Ό 찾음

    • 쒋은 μ„±λŠ₯을 λ‚΄λŠ” κ΅¬κ°„μœΌλ‘œ 점점 μ’ν˜€κ°€λ©° 탐색

    • RandomizedSearchCV()

    • k-fold 수 * n_iter 수 만큼 μ‹€ν–‰

각 ν•¨μˆ˜ 적용 ν›„ fit μ μš©ν•΄μ•Ό 함

classification_report : 평가 μ§€ν‘œμ— λŒ€ν•œ 더 μžμ„Έν•œ report 좜λ ₯

  • precesion, recall, f1-score, support, accuracy λ“±
profile
μžλΌλ‚˜λΌ μƒˆμ‹Ήμƒˆμ‹ΉπŸŒ±
post-custom-banner

0개의 λŒ“κΈ€