딥러닝 요약

현준·2024년 9월 6일

사관학교

목록 보기
22/23

딥러닝 모델 설계

  1. 신경망 구조 설계
  • 뼈대생성 : Sequential()
  • 입력층 : Dense(input_dim =)
  • 중간층 : Dense(units= , activation =)
  • 출력층 : Dense(units= , activation =)
  1. 학습방법 및 평가방법
  • model.compile(loss = , optimizer =, metrics=[ ])
  1. 모델학습
  • model.fit(X_train, y_train, validation_split= epochs = 반복횟수)
    * validation_split=0.2 > 20프로 때서 분석및 학습
  1. 모델 예측 및 평가
  • predict(X_test)
  • evaluate(X_test, y_test)

활성화함수

activation > 중간층, 출력층 (활용도가 다름)

  • 중간층 : 활성화/ 비활성화 (역치_활성화하기 위해 필요한 최소 자극의 크기)
    - 초기 : 계단함수 (stepfunction) (기울기 문제 발생) -> 시그모이드(sigmoid) (기울기 손실 발생)-> 렐루(rele)

  • 출력층 : 출력하고자하는 데이터의 형태를 지정

Dense(units = 데이터의 개수, activation = 형태 변경)
- 회귀 : units =1. activation = 'linear' 항등함수 y=x
- 이진분류 : units =1, activation = 'sigmoid'
- 다중분류 : units=클래스의 개수, activation='softmax'

학습방법 및 평가방법 설정

  1. loss (손실함수, 비용함수)
  • 회귀 : mse
  • 이중분류 : binary_crossentropy
  • 다중분류 : categorical_crossentropy
    ㄴ-> 그대로 가면 문제 발생 > 모델의 출력결과와 정답데이터의 형태가 달라 오류 발생

    sparse_categorical_crossentropy

  1. optimizer (최적화 함수)
  • 경사하강법 ->
  1. metrics
  • 회귀 : mse
  • 분류 : accuracy(정확도)

0개의 댓글