모두를 위한 딥러닝 시즌 1 #02

김은비·2022년 8월 11일
0
post-thumbnail

Predicting exam score : regression(0~100점)

  1. 10시간 공부한 사람은 90점, 9시간 공부한사람은 80점을 받을 것이라고 예측해 기존 데이터로 train 시킨다
  2. 이를 회귀(regression)로 구현한다
  3. 구현한 회귀모델을 바탕으로 7시간 공부한 사람을 몇점을 받을지 예측한다 -> 65점정도

Regression (data)

  • 회귀모델 만드는 법

    1. x, y값을 이용하여 그래프를 그린다
      x : 예측을 하기 위한 기본적인 자료 = feature
      y : 예측해야할 대상

    2. 데이터를 따라서 선을 긋고, 가장 잘 맞는 선을 찾는다(=학습한다)


(Linear) Hypothesis

< Linear Regression >

  1. 가설 : 공부한 시간이 많을수록 높은 시험 점수를 받는다, 집의 크기가 클수록 집의 가격이 높다
    H(x)=Wx+bH(x) = Wx + b
  1. 가설들을 그래프에 선으로 표현한다

  2. 위의 선들 중 어떤 선이 데이터와 가장 잘 맞는지 찾는다

    • 여기서 데이터와 가장 거리가 가까운 선이 가장 좋은 가설이다

Cost function(비용함수)

= Loss function

: 가설과 실제 데이터들이 얼마나다른지 계산하는 것
: 가설과 실제 데이터들의 거리가 얼마나 되는지 계산하는 것

cost=1mi=1m(H(xi)yi)2cost = \frac{1}{m} \sum_{i=1}^m(H(x^i) - y^i)^2
cost(W,b)=1mi=1m(H(xi)yi)2\\cost(W,b) = \frac{1}{m} \sum_{i=1}^m(H(x^i) - y^i)^2

-> 선과 각 데이터의 차이의 제곱을 모두 더해 평균을 계산
-> 이 값을 가장 작게 만드는 W와 b를 구하는 것(= cost를 최소화하는 것)

profile
레벨업중...

0개의 댓글