

머신러닝/딥러닝에서 사용하는 선형회귀 식
두 가지 표현의 회귀식은 오차항 포함 여부를 제외하고는 동일한 의미이다. (오차항을 제외한다고 했을 때) 회귀계수 () 또는 가중치 () 를 알면 X가 주어졌을 때 Y를 알 수 있다.
예시
예를 들어, 몸무게와 키의 관계에 대해 선형회귀 식이 y = 0.86x + 109.37 이라면 이는 1kg 증가할 때마다 키가 0.86 cm 증가한다는 것으로 해석할 수 있다.
MSE (Mean Squared Error)
기타 평가 지표
R Square
R 제곱은 결정계수라고도 불리며, 회귀 모델의 설명량을 평가하는 데 중요한 통계적 지표이다.
전체 모형에서 회귀선으로 설명할 수 있는 정도를 뜻한다.
이는 종속 변수의 변동성 중 독립 변수로 설명할 수 있는 비율을 나타낸다.
R 제곱은 상관계수 r을 제곱하여 계산할 수 있고, SSR을 SST로 나눈 값으로 계산된다.
용어 정리
: 특정 데이터의 실제 값
: 평균 값
: 예측 값, 추정한 값
SSR: Reression Sum of Squares
SSE: Error Sum of Squares
SST: Total Sum of Squares
총 제곱합
관찰된 종속변수의 각 값과 해당 변수의 평균값 사이의 차이를 제곱한 후, 모두 합한 값이다. 앞서 위의 2가지 지표를 총합한 값이다.
즉, SST는 SSR과 SSE로 구성된다. 식으로는 아래와 같다.

R Square 수식 정의
최종적으로, SST, SSR, SSE를 사용하여 아래와 같은 식의 결정계수가 계산된다.
R 제곱의 값은 0에서 1까지 가능하다.
라이브러리 불러오기

선형회귀 모델 불러온 후, 모델 적합
데이터 불러오기
- 샘플 데이터셋 : seaborn - 'tips'

선형회귀 모델 적합


Scatter Plot

평가
