- n 개의 층으로 이루어진 신경망이 있다고 하자
- 그리고 다음의 두 공식을 따른다
- z(l)=w(l)a(l−1)+b(l)
a(l)=σ(z(l))
- 식
- ∂w(l)∂J=∂a(n)∂J⋅(∂z(n)∂a(n)⋅∂a(n−1)∂z(n))⋅(∂z(n−1)∂a(n−1)⋅∂a(n−2)∂z(n−1))⋯∂w(l)∂z(l)
- =∂z(n)∂J⋅(σ′(z(l))⋅w(l))⋅(σ′(z(l−1))⋅w(l−1))⋯a(l−1)
- δ(l)=∂z(l)∂J 을 error signal이라 칭하면서 다음과 같이 표기할 수 있다
- δ(l)=∂z(l)∂J=∂z(l+1)∂J∂a(l)∂z(l+1)⋅∂z(l)∂a(l)
- =δ(l+1)⋅w(l+1)⋅σ′(z(l))
- ∂w(l)∂J=∂z(l)∂J∂w(l)∂z(l)
- =δ(l)a(l−1)
- 부록
- δ(l)=[∂z1(l+1)∂J∂z2(l+1)∂J⋯]⎣⎢⎢⎢⎢⎢⎢⎢⎡∂a1(l)∂z1(l+1)∂a1(l)∂z2(l+1)⋯∂a2(l)∂z1(l+1)⋯⎦⎥⎥⎥⎥⎥⎥⎥⎤⎣⎢⎢⎢⎢⎢⎢⎢⎡∂z1(l)∂a1(l)∂z1(l)∂a2(l)⋯∂z2(l)∂a1(l)⋯⎦⎥⎥⎥⎥⎥⎥⎥⎤
- =δ(l+1)⋅w(l+1)⋅σ′(z(l))