[실습편]AICE 연습사례(회귀)_미세먼지 수치 예측(딥러닝) - AI 모델링 및 적용(2) 실습1

Jingu_Jeon·2024년 12월 19일

AICE Basic 공부

목록 보기
44/45

딥러닝에서 수치예측

  • 딥러닝에서 수치예측을 할때는 Relu가 적절
  • sigmoid, softmax는 분류
  • tanh는 일반적으로 안쓰임, 특이한 상황에서 Relu 대신 사용
    1. 데이터 입출력 설정
  • 입력 데이터 처리 방식 설정
  • 스케일 문제
      • 히스토그램 만 봤을 때 해당컬럼에 문제가 있는거 같지만 distinct, zeros에 문제는 없다 다만 왼쪽에 심하게 몰려있는거 처럼 보이는거는 x 축 scale 문제 때문에 그러는 것
        • min 과 중앙값 그리고 max 값을 보면 매우 큰 이상치가 포함되는 것으로 확인됨.
  • location_code_OE
      • 딥러닝에서는 수치형 범주형 데이터를 그냥 수치형으로 판단함
      • 따라서 상황에 따라 해당 데이터가 수치형이 더 적절한지, 범주형이 더 적절한지 판단 후 설정 해당 상황에서는 로케이션 코드는 단지 순서도, 서열도, 높고 낮음 도 없는 단지 범주를 의미하므로 범주형(category)로 설정
  • fc레이어수(num_fc_layers)와 fc레이어크기(fc_size)
    • 레이어수는 레이어수 레이어크기는 노드 개수
      • 레이어수 0으로 했을때 디폴트로 설정
  • Iteration
      • 이터레이션 계산 방법은 일단 배치사이즈를 파악하고 train 데이터 수에 배치사이즈를 나누면 된다.
      • 따라서 1epoch 에 (학습데이터수/배치사이즈) = 110번 학습 한다고 할수있다.
  • Optimization
    • 딥러닝 모델의 매개변수를 조절해서 손실함수를 최저로 만드는 과정
  • 학습률
    • 손실함수의 미분 기울기의 이동 step을 의미함

Q7

    • 전체데이터의 명칭 : Epoch
    • 쪼개진 데이터의 명칭 : Batch size
profile
Back-end Developer를 목표로 하고 있는 전진구입니다.

0개의 댓글