Note 04: Model Selection

dot_trigger·2021년 10월 28일

코드스테이츠 부트캠프

목록 보기

14/19

10281150AM저장

Parameter vs Hyperparameter

Parameter: 머신이 학습하는 값 from data (인간이 개입 x)
if 데이터 many, 신경망 모델 good, 머신 두 for self
-데이터 찾기 쉽지 않지만 찾아 놓으면 머신이 알아서 하니까 쉬움

Hyperparameter : 인간이 결정하는 값
ex) learning rate, 훈련 회수, 가중치 초기값 등등
-손이 많이 감 (여러 값 직접 시도 해야 함) but 몇개는 추천 or고정 되어있긴 함.

ex) 최적의 learning rate 찾기 위해 이 하이퍼파라미터 튜닝을 반복
그러니까 train 에서는 파라미터 사용.
validation 에는 하이퍼파라미터 썼으니까. v데이터도 믿을 수 x. 그래서 이제 한번도 쓰지 않은 test 데이터로 성능을 써야지 믿을만한 지표가 되는 것.

하지만 데이터가 충분하지 않으면 어떻게 하냐..?
train/val/test/ 로 3분할 하기엔 너무 적다..!
.
차선책 is
.
K-fold validation
train 데이터를 K-등분

Hyperparameter 탐색

랜덤 >>그리드(초창기에 많이 씀) 이라고 밝혀짐

Why? : 하이퍼파라미터는 각각 중요도 차이가 크다.

결정해야 할 hyperparameter 많은데, 그중에서 learning rate(굉장히 중요💎) 그런데, 그리드에서는 쩌리랑 같이 위 그림 처럼 5개씩 동일하게 찾아짐.
하지만 랜덤을 쓰면 오른쪽 처럼 중요도 높은 러닝 레이트를 많이 찾음.