추론한 직선이 데이터에 얼마나 적합한지 수치화한다.
MSE(Mean Squread Error
제곱하는 이유? 상쇄되어 0이 나올 수도 있음
cost를 통해서 W와 b가 데이터를 얼마나 잘 설명하고 있는지 측정할 수 있다.
Cost를 최소화해야 한다.
W에 대한 Cost
기울기 > 0
? 음수 방향
: 양수 방향
:=
W를 업데이트Gradient Descent의 한계
--> Loss 변화 없음
--> Loss 폭발
📌 Note
- Gradient Descent 식 알아두기