딥러닝기초_0429

allzeroyou·2022년 4월 29일
0

딥러닝기초

목록 보기
13/22

오차역전파

어떤 알고리즘을 익힐 때
1. 원리 이해
2. 간소화된 식 보기
다음부터는 쉽게 이해할 수 있을 것.

기말고사 없음.
좀 더 원리와 알고리즘을 경험해보는 방향으로~!

시그모이드 입력값, 출력값을 이용

Affine/Softmax 계층 구현하기

affine: 행렬
softmax: 출력층의 활성화함수
행렬의 곱셈에 대한 역전파

벡터, 스칼라을 넘어 "행렬"

순전파

x: 1d matrix
w: 2d matrix
b: 1d matrix

숙제

다음시간에는 여태까지 해온 코드로 실습할 예정
앞에서 했던
4장 4.5절 에 대해 numerical_gradient는 느리니까 gradient를 써서 다양한 학습파라미터(학습률, 배치크기)을 적용해보고 결과 제출

profile
모든 건 zero 부터, 차근차근 헛둘헛둘

0개의 댓글