많은 데이터가 선형일 때 이 모델을 고려해볼 수 있다.
예를 들어, 이런 데이터인 경우.
from sklearn.linear_model import Ridge
r = Ridge(alpha = 20)
r.fit(train2, np.log(train['SalePrice']))
유의할 부분은 규제 부분이다.
하이퍼 파라미터를 잘 설정해줘야 한다.
자동으로 설정하는 방법이 있다는데, 아직 배우지 않았다!
일단 수동으로 수정했었는데, 알파값이 클 수록 결과가 좋았다.
뒷 부분은 다른 모델들과 비슷하다.
result = np.exp(r.predict(test2))
result
위에서 로그를 씌웠기 때문에 다시 빼주는 거 잊지말자.
로그에 대한 내용은 이전 글에서 확인할 수 있다.