Predicting exam score : regression(0~100점)
- 10시간 공부한 사람은 90점, 9시간 공부한사람은 80점을 받을 것이라고 예측해 기존 데이터로 train 시킨다
- 이를 회귀(regression)로 구현한다
- 구현한 회귀모델을 바탕으로 7시간 공부한 사람을 몇점을 받을지 예측한다 -> 65점정도
Regression (data)
-
회귀모델 만드는 법
-
x, y값을 이용하여 그래프를 그린다
x : 예측을 하기 위한 기본적인 자료 = feature
y : 예측해야할 대상
-
데이터를 따라서 선을 긋고, 가장 잘 맞는 선을 찾는다(=학습한다)
(Linear) Hypothesis
< Linear Regression >
- 가설 : 공부한 시간이 많을수록 높은 시험 점수를 받는다, 집의 크기가 클수록 집의 가격이 높다
H(x)=Wx+b
-
가설들을 그래프에 선으로 표현한다
-
위의 선들 중 어떤 선이 데이터와 가장 잘 맞는지 찾는다
- 여기서 데이터와 가장 거리가 가까운 선이 가장 좋은 가설이다
Cost function(비용함수)
= Loss function
: 가설과 실제 데이터들이 얼마나다른지 계산하는 것
: 가설과 실제 데이터들의 거리가 얼마나 되는지 계산하는 것
cost=m1i=1∑m(H(xi)−yi)2
cost(W,b)=m1i=1∑m(H(xi)−yi)2
-> 선과 각 데이터의 차이의 제곱을 모두 더해 평균을 계산
-> 이 값을 가장 작게 만드는 W와 b를 구하는 것(= cost를 최소화하는 것)