선형 회귀 모델

素人·2022년 1월 21일
0

Data

목록 보기
11/30

지도 학습의 대표적인 예로, 레이블(정답)이 있는 데이터를 다룬다.

회귀식에서 MSE(평균 제곱 오차)를 통해 가장 적합한 w와 b값을 찾는 일

★회귀 : 평균으로 돌아간다
→ 어떠한 변수가 평균값으로 돌아간다고 가정한다면,
평균값은 무엇이며, 평균값에 어떠한 변수들이 영향을 주는지 찾는 분석

회귀선 : H(X) = wx + b
※H(X) = 가설, w = x의 계수(가중치), b = 상수항

H(X) = 가설 >> 데이터와 가설의 차이(잔차)를 알아본다.

COST(LOSS) 함수

정확도를 높이는 방향으로 학습을 해야 하기 때문에 얼마나 틀렸는지 알 수 있는 정확도 기준을 컴퓨터에게 알려 주어야 한다. 이 때의 정확도 함수를 Cost 또는 Loss 함수라고 한다.

Cost 함수의 의미 = 오차를 제곱한 값들의 평균값
: 오차를 최소화하는 선이 회귀선이기 때문에 Cost 함수도 똑같은 형태를 가지게 됨!!!

이러한 식을 MSE(평균 제곱 오차)라고 한다.
Mse는 값이 작을 수도 좋다!

Cost 함수의 최적화 방법 : 경사하강법


처음 랜덤한 지점에 대해 미분값을 계산하고 지점보다 앞에 있는 값에 대해 미분값을 계산한 후에 앞에 있는 값의 미분값이 만약 더 작을 경우 앞으로 이동하는 방법이다.

여기서 한 번에 얼마나 앞으로 갈 것인지를 정해야 한다.
이 보폭을 Learning rate라고 한다.

최적화 알고리즘도 여러 개가 있기 때문에 머신러닝을 하려면 경사하강법 알고리즘 종류와 러닝레이트 두 가지를 결정해야 한다.

※파이썬에서 자주 사용되는 머신러닝 라이브러리는 tensorflow, keras가 있다.

profile
매일 조금씩:)

0개의 댓글