딥러닝 요약

현준·2024년 9월 6일

사관학교

목록 보기

22/23

딥러닝 모델 설계

신경망 구조 설계

뼈대생성 : Sequential()
입력층 : Dense(input_dim =)
중간층 : Dense(units= , activation =)
출력층 : Dense(units= , activation =)

학습방법 및 평가방법

model.compile(loss = , optimizer =, metrics=[ ])

모델학습

model.fit(X_train, y_train, validation_split= epochs = 반복횟수)
* validation_split=0.2 > 20프로 때서 분석및 학습

모델 예측 및 평가

predict(X_test)
evaluate(X_test, y_test)

활성화함수

activation > 중간층, 출력층 (활용도가 다름)

중간층 : 활성화/ 비활성화 (역치_활성화하기 위해 필요한 최소 자극의 크기)
- 초기 : 계단함수 (stepfunction) (기울기 문제 발생) -> 시그모이드(sigmoid) (기울기 손실 발생)-> 렐루(rele)
출력층 : 출력하고자하는 데이터의 형태를 지정

Dense(units = 데이터의 개수, activation = 형태 변경)
- 회귀 : units =1. activation = 'linear' 항등함수 y=x
- 이진분류 : units =1, activation = 'sigmoid'
- 다중분류 : units=클래스의 개수, activation='softmax'

학습방법 및 평가방법 설정

loss (손실함수, 비용함수)

회귀 : mse
이중분류 : binary_crossentropy
다중분류 : categorical_crossentropy
ㄴ-> 그대로 가면 문제 발생 > 모델의 출력결과와 정답데이터의 형태가 달라 오류 발생

sparse_categorical_crossentropy

optimizer (최적화 함수)

경사하강법 ->

metrics

회귀 : mse
분류 : accuracy(정확도)

이전 포스트

딥러닝

다음 포스트

딥러닝 - CNN

0개의 댓글