[ML] Linear Regression / Hypothesis / Cost

JINJU·2021년 5월 17일
0

Regression

-학생이 x시간만큼 공부했을 때 y만큼의 결과가 나올 것이다 라는 데이터 셋을 정의한 예이다.
-x: 예측을 하는데 필요한 데이터
-Y: 예측을 해야하는 결과값
-왼쪽은 데이터셋, 오른쪽은 왼쪽 표를 바탕으로 x를 기준으로 y의 결과값을 그래프로 나타낸 것

(Linear) Hypothesis

-학생이 공부를 많이 할수록 성적이 높아지는 것, 훈련을 많이 할수록 달리기 실력이 늘어나는 것, 집의 크기가 클수록 집 값이 올라가는 것과 같이 linear 하게 가설을 세울 수 있는 예들이 있다.
-어떤 데이터가 있다면 그래프에 linear하게 증가하는 어떤 선이 맞을 것인지를 가설세우는 것

-위 그림과 같은 식이 가설을 세우기 위한 첫번째 단계
-W와 b의 값에 따라 다른 형태의 linear이 나타남

Which hypothesis is better?

-이러한 많은 선 중에 어떠한 선(모델)이 좋은 것인지

Cost(Loss) function

-어떤 선(모델)이 실제 선과 거리가 얼마나 거리를 계산 (가깝다면 좋은 것, 멀다면 안좋은 것)
-(H(w) - y)^2 : Cost function


-각 x의 1, 2, 3의 가설의 식과 실제의 식을 뺀 것을 제곱하고 더한 것을 데이터 갯수만큼 나눠줌 (m: 데이터 갯수)
-따라서 식 아래와 같이 식을 도래할 수 있음

Reference

[sung kim 교수님 강의]https://www.youtube.com/watch?v=Hax03rCn3UI&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=5

0개의 댓글