8. Advice for applying machine learning

jisu_log·2024년 10월 16일

Machine Learning

목록 보기
8/15

- Debugging a learning algorithm

  • 더 많은 훈련 데이터 얻기
  • 더 작은 feature 집합 사용 시도
  • 추가적인 feature 얻기 시도
  • 다항식(polynomial) feature 추가 시도
  • lambda (정규화 항) 줄이기
  • lambda 늘리기
  • learning rate 늘리기, 줄이기
  • iteration 수 늘리기, 줄이기
    등...

- Machine learning diagnostic

  • Diagnostic(진단)
    : 학습 알고리즘에서 무엇이 잘 작동하고 있거나 잘못되고 있는지 파악하고, 성능을 어떻게 개선할 수 있을지에 대한 지침을 얻기 위해 실행할 수 있는 테스트
    : 진단을 구현하는 데 시간이 걸릴 수 있지만, 이를 수행하는 것은 매우 유익한 시간 활용이 될 수 있음

- Evaluating a hypothesis


-> Training Set : Test Set = 7 : 3 (Training Set이 더 큼)


-> validation set도 있는게 가장 좋음
-> validation set으로 hyperparameter 튜닝


-> 폴드로 나눈 데이터 중 하나의 폴드를 테스트 세트로 설정하고, 나머지 폴드는 훈련 세트로 사용함

  • Cross-Validation, 교차 검증
    : 데이터를 폴드(folds)로 나누고, 각 폴드를 검증 세트로 사용해 평가를 한 후 결과를 평균함
    -> 소규모 데이터셋에 유용하지만, 딥러닝에서는 자주 사용 X
    -> 각 fold는 서로 exclusive(중복X) 해야 함!



-> linear인 경우에는 ground truth(정답 라벨)와 차이 평균 내서 test error 계산


- Model selection and training/ validation / test sets

  • Model selection

0개의 댓글