02-2. MLP (Multi Layer Perceptron)

𝐌𝐢𝐧𝐣𝐢·2021년 8월 16일

AI Tech Cross Entropy Deep Learning MLE MSE loss function mlp 부스트캠프

0

Deep Learning Basic

목록 보기

3/4

이 글과 이어집니다!

Multi Layer Perceptron

선형 변환은 층을 쌓아도 행렬곱 형태가 되어서, 다시 $Wx+b$ 형태가 된다.
따라서 Activation Function 등을 이용하여 비선형변환 ( $p$ )를 해주어야 한다.

다층 퍼셉트론 (MLP)는 은닉층마다 선형, 비선형 변환을 수행하는 다층의 인공 신경망을 의미한다.

Loss function

Key Points

각각의 Loss function들이 어떤 성질을 가지고 있나?

이 Loss function을 이용하면 왜 내가 원하는 결과를 얻을 수 있는가?

MSE (Mean Square Error) - Regression Task

주의할 점

제곱을 하기 때문에, 차이가 크면 Outlier가 너무 커질 수도 있다.
제곱 대신에 절댓값을 취하면 MAE(Mean Absolute Error)가 된다.
- MAE는 MSE에 비해 outlier에 덜 민감하다.
outlier가 덜하다는 확신이 있을 경우, MSE가 더 좋다.
- ~~MAE는 median을 기준으로, MSE는 평균을 기준으로 data를 fitting 시키기 때문에 보통 MSE가 더 권장됨 (출처)~~
MSE는 손실함수로 쓰이고 MAE는 회귀 지표로 쓰임

CE (Cross Entropy) - Classification Task

Classification task에서 보통 output은 One-hot Encoding되어있다.
- ex) 10개의 class, dog가 찾아진 경우 dog만 1, 나머지는 0
따라서 cross entropy 식에서 $D$ 개의 $y_i^{(d)}$ 중에 유효한 값은 1개이다.
즉, 정답에 해당하는 출력값만 키우는 것이 목적이다. 얼마나 더 키우냐?는 중요하지 않고, 가장 큰 값만 고려되므로 just 크기만 하면 된다.

MLE (Maximum Likelihood Estimation) - Probabilistic Task

output을 확률로 내보내는 모델에서 사용 (예측모델 등...)

𝐌𝐢𝐧𝐣𝐢

🐢

이전 포스트

02-1. Neural Networks

다음 포스트

03. Optimization (부제: 딥러닝 용어 정리)

0개의 댓글