AICE 베이직 자주 볼거

Jingu_Jeon·2024년 12월 18일

AICE Basic 공부

목록 보기
33/45
  • 데이터량에 따른 적절한 정도
    • Epochs
      • < 1000
        • 20~50
      • 1000~10000
        • 50~100
      • 10000 <
        • 10~50
    • Batch size
      • < 1000
        • 8~32
      • 1000~10000
        • 32~128
      • 10000 <
        • 128~512
    • 학습률
      • < 1000
        • 0.0001~0.001
      • 1000~10000
        • 0.001~0.01
      • 10000 <
        • 0.01~0.1
    • 교차 검증 Fold 수
      • < 1000
        • 3~5
      • 1000~10000
        • 5~10
      • 10000 <
        • 10~20

학습 시킬때 순서

    1. 현재 문제상황에 제일 효율적인 활성함수 선택
    1. 에폭스는 일단 크게(과적합되는 부분을 찾아야해서 500으로설정)
    1. 배치사이즈, 학습률 데이터 크기 기반한 가이드의 최대한 작게설정(배치사이즈, 학습률은 작을수록 좋음, 단 과적합을 방지할 수 있다는 과정하에)
    1. 천천히 배치사이즈, 학습률 올리면서 정확도 비교(제일 낮을때랑 차이없다면 낮은걸로)
    1. 과적한되는 부분이 얼리스탑으로 찾아지면 epochs를 그걸로 설정
    1. 교차검증 fold 수는 데이터량 기준으로 된 가이드로 설정

시험시 알아야할것

  • 1. 데이터 가공시 제대로 적용되었는지 변수 비교를 통해 확인 저장하기가 잘 안되는 경우가 있음
  • 2. 데이터 가공시 라벨변수는 건들지 말것
  • 3. 데이터 가공시 기존 변수는 삭제하지 말것
  • 4. 모델링 성능 향상시 배치사이즈, 학습률, fc 관련 파라미터는 건들지 말것 해야하는것은 스케일링과 epochs 늘리기 만약 이랬는데도 안되면 그때 생각
  • 5. 숫자 적을때 잘 적기
  • 6. 기본적으로 문제잘읽기 마지막 제출전에 작은거인지 큰거인지 다시 확인
  • 7. 첫 모델 학습시 모델 중복 선택되어있는지 제대로 확인

인코딩
AI 모델링 및 활용

수치형 컬럼은 별도의 설정 필요 없음

  • 수치형 카테고리 컬럼의 데이터 유형을 numeric ➔ categorical 로 변경

  • 문자형 컬럼의 데이터 유형은 카테고리로 설정

  • One-hot Encoding 필요한 경우, ➔ sparse 인코더 사용

  • Ordinal Encoding 필요한 경우,➔ dense 인코더 사용

Basic 정리한 다른 블로그

profile
Back-end Developer를 목표로 하고 있는 전진구입니다.

0개의 댓글