scikit-learn - 20 (회귀 | 평가)

안동균·2024년 11월 13일

평가 지표

MAE(평균 절대 오차)

실제 값과 예측 값 차이 -> 절대값 평균

from sklearn.metrics import mean_absolute_error
mean_absolute_error(y_test, pred)

MSE(평균 제곱 오차)

실제 값과 예측 값 차이 -> 제곱해 평균

from sklearn.metrics import mean_squared_error
mean_squared_error(y_test, pred)

RMSE(MSE에 루트를 씌움)

MSE가 실제 오류보다 커지는 특성이 존재하여 루트 활용

import numpy as np
np.sqrt(mean_squared_error(y_test, pred))

RMSLE(RMSE에 로그 적용)

예측 값이 실제 값 보다 작을 때 더 큰 페널티 부여

ex) 배달 20분을 예측했는데 40분 걸리면 페널티

from sklearn.metrics import mean_squared_log_error
np.sqrt(mean_squared_log_error(y_test, pred))

R2(결정 계수)

실제 값의 분산 대비 예측 값의 분산 계산

1에 가까울수록 성능 좋음

from sklearn.metrics import r2_score
r2_score(y_test, pred)`

0개의 댓글