02-2. MLP (Multi Layer Perceptron)

𝐌𝐢𝐧𝐣𝐢·2021년 8월 16일
0

Deep Learning Basic

목록 보기
3/4

이 글과 이어집니다!


Multi Layer Perceptron

  • 선형 변환은 층을 쌓아도 행렬곱 형태가 되어서, 다시 Wx+bWx+b형태가 된다.
  • 따라서 Activation Function 등을 이용하여 비선형변환 (pp)를 해주어야 한다.

  • 다층 퍼셉트론 (MLP)는 은닉층마다 선형, 비선형 변환을 수행하는 다층의 인공 신경망을 의미한다.

Loss function

Key Points

  • 각각의 Loss function들이 어떤 성질을 가지고 있나?
  • 이 Loss function을 이용하면 왜 내가 원하는 결과를 얻을 수 있는가?

MSE (Mean Square Error) - Regression Task

주의할 점

  • 제곱을 하기 때문에, 차이가 크면 Outlier가 너무 커질 수도 있다.

  • 제곱 대신에 절댓값을 취하면 MAE(Mean Absolute Error)가 된다.

    • MAEMSE에 비해 outlier에 덜 민감하다.
  • outlier가 덜하다는 확신이 있을 경우, MSE가 더 좋다.

    • MAE는 median을 기준으로, MSE는 평균을 기준으로 data를 fitting 시키기 때문에 보통 MSE가 더 권장됨 (출처)
  • MSE는 손실함수로 쓰이고 MAE는 회귀 지표로 쓰임


CE (Cross Entropy) - Classification Task

  • Classification task에서 보통 output은 One-hot Encoding되어있다.

    • ex) 10개의 class, dog가 찾아진 경우 dog만 1, 나머지는 0
  • 따라서 cross entropy 식에서 DD개의 yi(d)y_i^{(d)} 중에 유효한 값은 1개이다.

  • 즉, 정답에 해당하는 출력값만 키우는 것이 목적이다. 얼마나 더 키우냐?는 중요하지 않고, 가장 큰 값만 고려되므로 just 크기만 하면 된다.

MLE (Maximum Likelihood Estimation) - Probabilistic Task

  • output을 확률로 내보내는 모델에서 사용 (예측모델 등...)

0개의 댓글