머신러닝 (5)

MSMoon·2025년 4월 20일

데이터 이론 학습

목록 보기
15/27
post-thumbnail

Chapter 10 하이퍼파라미터 튜닝

1) 교차 검증

  • 과적합: 모델이 학습 데이터에만 과도하게 최적화되어 일반화된 데이터에서는 예측 성능이 과하게 떨어지는 현상

  • holdout

  • k-fold cross validation

  • stratified k-fold cross validation

  • 검증 validation이 끝난 후 test용 데이터로 최종 평가

2) 하이퍼파라미터 튜닝

  • 모델의 성능을 확보하기 위해 조절하는 설정 값

  • 튜닝 대상
    -> 결정나무에서 튜닝해 볼만한 것은 max_depth
    -> 간단하게 반복문으로 max_depth를 바꿔가며 테스트해볼 수 있을 것

하이퍼파라미터

Chapter 11 Precision and Recall

Precision and Recall

Chapter 12 kNN

  • 새로운 데이터가 있을 때, 기존 데이터의 그룹 중 어떤 그룹에 속하는지를 분류하는 문제

  • k는 몇번째 가까운 데이터까지 볼 것인가를 정하는 수치

  • k=5로 설정하면 5번째까지 가까운 데이터

  • k값에 따라 결과값이 바뀔 수 있음

  • 거리를 계산하는 것 -> 유클리드 기하

kNN

이 글은 제로베이스 강의 자료 일부를 발췌하여 작성되었습니다

0개의 댓글