다변수 다루기
multi-class classification : 출력값이 여러 개 일 때

Issue : How we apply gradient descent for multiple parameters ?
파라미터가 여러 개여도 편미분을 하면 그 축에 대한 기울기를 알 수 있다.

변수가 많아지더라도 각각을 미분한 후 합치면 된다는 것이 Multinomial Regression 의 핵심 아이디어이다.

Hypothesis 를 다항식으로 표현하지 않고 data 와 weight 의 곱으로 표현한다.
Use binary classification for each class


binary cross entropy is a special type of cross entropy