로그를 사용하기 전에 꼭 확인해 볼 한가지가 있다.
import seaborn as sns
sns.displot(train['count'])
이 그래프를 그려서 한쪽으로 쏠려있으면 로그를 사용할 것!
이 그래프에 로그를 씌운 결과는 아래와 같이 확인할 수 있다.
sns.displot(np.log(train['count']))
만약에 이렇게 로그를 사용할 수 있는 상황이라면
from xgboost import XGBRegressor
xgb = XGBRegressor()
xgb.fit(train2, np.log(train['count']))
위처럼 모델을 학습할때 집어넣으면 된다.
np.log(train['count'])
요러케
로그를 씌워줬으니 다시 지수로그로 바꿔줘야 하므로
result_xgb_count = np.exp(xgb.predict(test2))
result_xgb_count
예측값을 뽑아낼 때 같이 넣어주면 된다.
np.exp(xgb.predict(test2))
요러케!
해당 칼럼에 0이 있으면 안된다. 다음 글을 참고하자!