#2 Machine Learning : How to minimize Cost

yenn·2021년 1월 10일

Machine Learning

목록 보기

2/2

hypothesis
H(x) = Wx

$cost(W,b) = \frac{1}{m} \sum^m_{i=1} (H{x^{(i)}} - y^{(i)})^2$

⇒ 최소점(minimize) 를 찾는게 목표

$cost(W) = \frac{1}{m} \sum^m_{i=1} (W{x^{(i)}} - y^{(i)})^2$

미분시 계산 편의를 위해 아래 수식과 같이 변환

$cost(W) = \frac{1}{2m} \sum^m_{i=1} (W{x^{(i)}} - y^{(i)})^2$

: cost 함수를 최소화 하는 W를 구하고 모델을 만들 수 있다.

$W := W - \alpha \frac{1}{2m} \sum^m_{i=1} (W{x^{(i)}} - y^{(i)})x^{(i)}$

* α : learning rate (상수) 
* := : "assignment" 연산자

: cost function을 3차원으로 나타내었을 때, Gradient descent algorithm을 적용하여 기울기를 내려가 보면 최소화되는 지점이 여러군데 생길 수 있으므로 알고리즘이 제대로 동작하지 않는 단점이 있음

: cost function 의 단점을 보완하기 위해서, Hypothesis와 cost function을 사용하여 Convex function을 아래와 같이 만들어주면, 어느 지점에서 시작하든 간에 도착하는 점이 최소값이 됨

즉, cost function을 설계할 때 반드시 아래로 볼록한 모양을 가지는 Convex function이 되어야 함

Junior BackendEngineer 😎