이러한 x들을 y에 매핑하는 방식에 대해 학습해야할 것
예측된 값과 실제 값 사이의 불일치를 표현하는 것이 Loss
- : 최적화할 파라미터집합
- 스칼라, 벡터, 행렬, 행렬집합 등이 될 수 있음
- deepwalk에서의 사례를 생각하면, , =임베딩룩업
- : loss function (예시:L2 loss,회귀분석에 자주 사용)
실제값-예측값의 차이의 제곱의 합- 일반적인 다른 loss function : L1 loss, huber loss, max margin, cross entropy..
Loss func. CE에 대해 예제를 통해 개념을 알아보기1.3까지를 통해 Loss function을 알아보았으며, 이를 어떻게 최적화할까?
👉 개선된 Optimizer에 대한 참고사항
f(x)의 간단한 사례에 대해서 알아보자!
기계적인 기울기 계산이 가능하게 한 방법이라는 점에서 유의미2-layer linear network 예제
- minibatch 에 대한 L2 loss summation
- Hidden layer : input 에 대한 중간단계 표현
- 를 hidden layer로 칭함 (중간단계 결과값)
forward propagation
Back-propagation
활성화 함수에 대해 알아보자
각 층에서 선형변환, 비선형변환을 결합하는 형태
- 은 에서 layer 로 변환해주는 hidden representation
- 은 layer 에서, 에 대한 선형이동 ()
- 는 non-linearity function (예:sigmoid)
- 는 선형레이어, MLP, GNN 등이 될 수 있음
~끝~