8. Advice for applying machine learning

jisu_log·2024년 10월 16일

Machine Learning

목록 보기

8/15

Diagnostic(진단)
: 학습 알고리즘에서 무엇이 잘 작동하고 있거나 잘못되고 있는지 파악하고, 성능을 어떻게 개선할 수 있을지에 대한 지침을 얻기 위해 실행할 수 있는 테스트
: 진단을 구현하는 데 시간이 걸릴 수 있지만, 이를 수행하는 것은 매우 유익한 시간 활용이 될 수 있음

-> Training Set : Test Set = 7 : 3 (Training Set이 더 큼)

-> validation set도 있는게 가장 좋음
-> validation set으로 hyperparameter 튜닝함

-> 폴드로 나눈 데이터 중 하나의 폴드를 테스트 세트로 설정하고, 나머지 폴드는 훈련 세트로 사용함

Cross-Validation, 교차 검증
: 데이터를 폴드(folds)로 나누고, 각 폴드를 검증 세트로 사용해 평가를 한 후 결과를 평균함
-> 소규모 데이터셋에 유용하지만, 딥러닝에서는 자주 사용 X
-> 각 fold는 서로 exclusive(중복X) 해야 함!

-> linear인 경우에는 ground truth(정답 라벨)와 차이 평균 내서 test error 계산