Day68

김재현·2023년 8월 28일

JUPYTER/DL/ML

목록 보기
41/73

sklearn은 ols(회귀분석)과 별 차이가 없는 모듈.

성능 지표

  • 잔차를 사용한 모델 성능(실제 값, 예측 값).
  • train/test로 훈련/검증 데이터 분류.

MSE, MAE는 함수가 제공되지만 RMSE, MAPE만큼은 수동으로 계산해야함.

.values를 사용하는 이유는 y_train, y_test는 데이터프레임, pred는 numpy 배열 형식이기 때문에 데이터 형식을 일치시키기 위함. (numpy 배열 혹은 Series 형식으로 통일)

에러율에는 절대적인 기준이 존재하지 않음.

  • 교차검증
    최적의 결과를 유도하기 위해서는 모든 경우의 수를 생성하는 코드를 사용해 결과를 유도한다.

    대표적으로 k-fold cross validation(K겹 교차 검증)

0개의 댓글