[실습편]AICE 연습사례(분류)_중공업 수주 여부 예측(딥러닝) - AI 모델링 및 적용(1) 핵심개념

Jingu_Jeon·2024년 12월 18일

AICE Basic 공부

목록 보기
32/45

AI 모델링 및 적용

  • 1. 데이터 분리

    • Train
      • 60%
    • Test
      • 20%
    • Valid
      • 20%
  • 2. Model 구조 파라미터 설정

    • 1. 입력 Column 설정

    • 2. 라벨 Column 설정

        • 타겟변수가 범주형이므로 분류

        • 이진분류면 Sigmoid 다중분류면 Softmax

        • 히든 레이어 설정

          • 처음은 FC 레이어 수 1, FC 레이어 크기 64로 설정하고 조금식 늘리면서 성능 향상을 확인
    • Dropout

      • Overfitting을 방지하기 위해 사용하는 테크닉
      • 0.2, 0.3 권장
    • Epoch

      • 데이터 크기에 따라 적절하게
      • 20~30 넣고 적절히 조절
    • Batch Size

      • 데이터 크기에 따라 적절하게
    • Early Stopping

      • 대표적인 Overfitting 방지 기법
      • Train loss는 감소하나, Valid loss가 감소하지 않는 학습을 중지
      • 만약 5라면 5번 은 봐줌
    • Optimizer

      • loss 함수의 최적의 gradient를 찾는 알고리즘을 Optimizer 라고 함
      • GD -> SGD -> ADAM 순
      • ADAM
      • SGD
      • SGD -> ADAM 으로 비교 테스트를 하면서 성능 분석
    • Learning Rate

      • Gradient를 위해 이동하는 보폭
        • 학습 속도등을 고려하여, 파라미터 선택 필요
        • 대개 0.01, 0.001, 0.0001중 선택
        • 보통 0.001 설정하고 비교하면서 파악
  • AI 과제 유형별 성능평가 지표

    • Regression Model
      • MSE
      • MAE
    • Classification Model
      • Accuracy(정확도)
      • Precision(정밀도)
      • recall(재현율)
        • 정밀도와 재현율 둘중 뭐가 중요한지 판단하여 한쪽의 성능을 높이는 쪽으로 학습 진행
  • Vailid Accuracy를 보고 Over/Under-fitting 발생 여부 판단

    • 해당 작업후에 추가 Hyper-parameter Tuning 작업 진행
      • 과적합
        • Training Accuracy : 98%
        • Validation Accuracy : 80%
          • 훈련 데이터 정확도는 높으나 검증 데이터 정확도는 낮음
          • Train loss는 감소하나, Valid loss가 감소하지 않음 와 같은 말
          • 훈련 데이터에만 잘 맞고 일반화가 안되는 과적합
            • 해당 사진은 훈련, 검증 정확도가 비슷하므로 최소한 과적합 상태는 아니다라고 파악 가능
      • 과소적합
        • Training Accuracy : 70%
        • Validation Accuracy : 65%
          • 데이터의 복잡한 관계를 제대로 파악하지 못함
  • Confusion Matrix

    • recall, precision들을 그래프로 나타낸 것
profile
Back-end Developer를 목표로 하고 있는 전진구입니다.

0개의 댓글