모두를 위한 딥러닝 시즌 1: Lecture 2 :: Linear Regression

Uomnf97·2021년 5월 23일

Linear Regression cost function hypothesis

모두를 위한 Deep Learning 시즌 1 -개념보충학습

목록 보기

2/13

Linear Regression

Linear Regression은 다음과 같은 방식으로 데이터가 주어진다. x는 예측을 하기위한 기본적인 자료로 주어지고, y에 해당하는 score는 예측할 대상이다. 이 때 회귀의 특징은 예측할 대상인 y가 연속적으로 넓은 범위(예시에서는 0~100)이 주어진다는 것이다. 그럼 다음과 같이 training set이 주어지고 Regression 모델에 의해 학습이 되어, 예시와 같이 x의 값이 주어졌을 때, y값을 추론하는 방식의 추론 모델을 Regression을 통해 만들 수 있게 된다.

Hypothesis

Hypothesis란? 추론 모델을 의미한다. Linear Regression에서는 추론모델이 Linear 즉 다음과 같이 선형성이 있다고 가정을 하고 예측을 하는 것이다. 많은 경우에 Linear 모델로 설명할 수 있는 경우가 많기 때문에 자주 사용한다.
Ex) 시간에 따른 성적예측 -공부 시간이 많을수록 성적이 잘나옴
Ex) 훈련양에 따른 성적예측 - 훈련 시간이 많을 수록 성적이 잘 나옴
Ex) 집값 예측 - 큰집일 수록 집 가격이 높음.

어떤 것을 선형 모델을 Hypothesis 모델로 활용해야할까?
실제 데이터와 선형 모델이 거리가 멀면 나쁜 모델링, 거리가 가까우면 좋은 모델링이라고 할 수 있다. 따라서 거리가 가깝도록 모델링을 해야한다.

Cost Function

Cost Function이란? Loss Function이라고 말하며, 예측 모델과 실제 데이터 사이의 차이를 나타낸 함수를 의미한다. H(x) -y(모델 - 실제값)으로 표기할 수 있으나, 보통의 경우에는 (H(x)-y)^2
으로 많이 쓰인다.

(H(x)-y)^2으로 많이 쓰이는 이유: 항상 양수의 값을 일정하게 얻을 수 있고, 차이가 클 경우 더 큰 페널티를 주게되어 모델링을 더욱 정교하게 할 수 있도록 도와줌.
손실 함수 식
이 손실함수의 손실값을 줄어주는 방향으로 W와 b의 값을 학습하여 H(x), 즉 함수 모델을 구해줌

사회적 가치를 실현하는 프로그래머

이전 포스트

모두를 위한 딥러닝 1 :: Lecture 1 Machine Learning Basics

다음 포스트

모두를 위한 딥러닝 1 :: Lecture 3 How to minimize cost

0개의 댓글