1 Dec, 2021

wannabedatazzang·2021년 12월 1일

[Sol] Today I Learned

목록 보기
10/15

[Project]

1. parking

Robust scaler : 이 스케일러는 중앙값을 제거하고 Quantile 범위 (기본값은 IQR : Interquartile Range)에 따라 데이터를 스케일링합니다. IQR은 1 분위 (25 분위)와 3 분위 (75 분위) 사이의 범위입니다. 아웃라이어 영향을 최소화한다.
StratifedKfold : 계층을 가진 Fold를 리턴하는 KFold의 변형된 반복자입니다. 각각 비율이 다른 클래스의 비율을 유지하면서 훈련과 테스트 세트를 분류합니다.

cross validation 시, 데이터가 많은 경우는 test train split을 한 데이터를 사용할 수도 있지만 데이터가 적은 경우에는 계속 적은 데이터를 가지고 검증을 해야하기 때문에 좋은 방법이 아닐 수 있다. 그래서 test train split을 하지 않은 데이터를 이용해도 된다.

0개의 댓글