Linear --- y= Wx
Loss function -Multiclass SVM loss 하지만 이 loss function에는 문제가 있다. 만약 L이 0가 되는 W를 찾는다면, W는 유일한 해를 갖지는 않는다.
-Softmax loss
optimization -random search(그냥 랜덤으로 해본 다음에 이제 어떤 게 제일 나았는지 best 뽑음) -미분/편미분 이용 gradient dW