Loss Function
Loss = 모델의 예측 y^ 실제 정답 y의 차이
Loss Function = loss를 계산하는 함수
Binary Cross Entropy
J(y,y^)=−[ylog(y^)+(1−y)log(1−y^)],0<y^<1
파이썬으로 표현하기
import numpy as np
class BCELoss:
def forward(self, y, pred):
j = -(y * np.log(pred) + ((1 - y) * np.log(1 - pred)))
return j
Differentiation
평균변화율(ARC, Average Rate of Change)
- 평균 변화율: Secanct line의 기울기
- Secant line: 주어진 두 점을 지나는 직선
ΔxΔy=x1−x0y1−y0
순간변화율(IRC, Instantaneous Rate of Change)
- tangent line : 주어진 점을 지나며 함수에 접하는 직선
- 특정 점의 순간변화율이 해당 점을 지나는 tangent line의 기울기다
- x=x0 일때 tangent line의 기울기를 f′(x0) 로 나타낸다
- 이를 다른 이름으로
접선의 기울기 , 미분계수 라고도 한다
Δx→0limΔxΔy=f′(x0)
f′(x0)=Δx→0limΔxf(x0+Δx)−f(x0)
여기서 특정 x0가 아닌 일반적 x에 대한 미분계수를 구하기 위해 고안된것이 있다.
도함수
f′(x)=Δx→0limΔxf(x+Δx)−f(x)
위 함수는 미분계수를 구하고자 하는 x를 f′(x)에 입력하면 해당 x에 대한 미분계수를 출력해준다.
편미분
다변수 함수의 특정 변수를 제외한 나머지 변수를 상수로 간주하여 미분하는 것
Affine function의 편미분
z=w1x1+w2x2+...+wnxn+b
∂w1∂z=x1
∂w2∂z=x2
∂b∂z=b
Sigmoid의 편미분
σ(z)=1+e−z1=(1+e−z)−1
∂z∂σ=σ(1−σ)
BCE(Binary Cross Entropy) Loss function의 편미분
J=−[ylog(y^)+(1−y)log(1−y^)]
∂y^∂J=y^(1−y^)y^−y