6일차 학습정리

이호영·2021년 8월 9일

AI Tech boostcamp

강의복습 내용

Cross-Entropy

손실함수
$-\frac{1}{n} \sum_{i=1}^{n} \sum_{c=1}^{C} L_{i c} \log \left(P_{i c}\right)$

n: 데이터 개수
C: 범주 개수
L: 실제 데이터값
P: 실제 데이터값의 확률값

Entropy

$H(q)=-\sum_{c=1}^{C} q\left(y_{c}\right) \log \left(q\left(y_{c}\right)\right)$

Entropy는 불확실성이 더 커질수록 커지며 9:1 비율의 분포보다 5:5의 분포에서 더 커진다.

Cross Entropy

$H_{p}(q)=-\sum_{c=1}^{C} q\left(y_{c}\right) \log \left(p\left(y_{c}\right)\right)$

실제 분포인 q를 모를 때 모델링을 통해 이미 알고 있는 p의 분포를 통해서 q를 예측하는 것이다. 식에 p와 q가 모두 들어가기 때문에 cross-entropy라는 이름이 붙여졌다. 실제값과 예측값이 비슷해질수록 값이 작아지고 달라질수록 값이 커져서 실제값과 예측값의 차이를 줄일 때 사용을 한다.

Likelihood for Bernoulli Distribution

파라미터 $\pi$ 를 따르는 어떤 확률 분포를 $f(Y ; \pi)$ 라고 할 때 y에 대한 베르누이 분포는 다음 식과 같다.

$f(Y=y ; \pi)=\pi^{y}(1-\pi)^{1-y}, y \in\{0,1\}$

y를 고정 시키고 $\pi$ 에 대한 함수로 나타내면 가능도 함수가 된다.
$L(\pi \mid y)=\prod_{i=1}^{n} f\left(y_{i} ; \pi\right), y_{i} \in\{0,1\}, i=1 \ldots n$

Log Likelihood for Bernoulli Distribution

$\begin{aligned} l(\pi \mid y) &=\log (L(\pi \mid y)) \\ &=\log \left(\prod_{i=1}^{n} f\left(y_{i} ; \pi\right)\right) \\ &=\sum_{i=1}^{n} \log \left(f\left(y_{i} ; \pi\right)\right) \\ &=\sum_{i=1}^{n} \log \left(\pi^{y_{i}}(1-\pi)^{1-y_{i}}\right) \\ &=\sum_{i=1}^{n}\left(y_{i} \log (\pi)+\left(1-y_{i}\right) \log (1-\pi)\right) \end{aligned}$