profile
a personal blog
post-thumbnail

딥러닝에서의 역전파와 미분

딥러닝에서 미분값의 사용 딥러닝에서 미분값의 사용은 정확히는 손실함수의 특정변수에 대한 미분값이 사용된다. 손실함수는 정답과 예측값의 차이를 대변해주는 것이다. 정답은 고정되어 상수이지만, 예측값의 경우 여러 가중치와 입력값 그리고 활성화 함수의 조합이다. 우리가 업데이트, 즉 학습과정에서 수정이 필요한 변수는 가중치이다. 가중치는 입력값에 곱해지고 더해진다.(입력값 x weight + bias : 아핀변환) 그리고나서 활성화 함수라는 비선형 함수의 입력으로 들어간다. 활성화 함수를 통해 나온 결괏값은 다시 다음 레이어의 입력으로 투입된다. 같은 현상의 반복이다. 예시로 두개의 활성화 함수를 엮어본다면 다음과 같은 수식으로 적을 수 있다. = 활성화함수1(활성화함수2(wx+b) x w + b) 즉 이 구

2023년 4월 19일
·
0개의 댓글
·