
학습하는 방법에 따라 분류Supervised Learning \- learning w/ labeled examples - training set Unsupervised Learning (un-labeled data) \- grouping \- word clust

`H(x)
Learning rate Gradient descent > cost function을 최소화하기 위한 필요한 것으로 learning rate 존재 Large learning rate: overshooting cost function이 줄어들지 않고 큰 값으로 가다가
Binary Classification > 주어진 데이터를 두 개의 클래스 중 하나로 분류하는 작업 ex. 이메일이 스팸인지 아닌지 판단 고객이 상품을 구매할지 말지 예측 Logistic Classification 로지스틱 회귀는 이진 분류 문제를 해결하는 대표
Multinomial Classification > 3개의 각각 다른(서로 독립된) binary classification으로 구현 가능 > 각각의 classification 을 갖는 것보다 하나의 weight matrix 계산을 통해 한번에 독립된 classifi