4일차 이야기
upstageAI 안창배 강사님 이야기.
선형회귀란?
@@ 수학교실 선형대수 칸아카데미
- 회귀 - 평균으로의 회귀(통계적), 머신러닝에서는 예측에 숫자는 회귀, 카테고리는 분류.
- 선형 - 직선의 선형성.
<일반화 선형모형>
y = ax + b
로지스틱 함수
<단순선형회귀>
- 데이터들을 잘 설명하는 직선
- 설명변수 x 1개, 종속변수 y 1개
<다중 회귀>
- 설명변수 x 여러개, 종속변수 y 1개
목표 : 오차항을 최소화 하기 위함 (제곱해서 뻄)
- min(y−ax−b)2 = e --> 최소자승법(공분산 / 표본분산) 미분
< 수정계수 (0 <= R <= 1) >
기울기가 중요한 이유
- x(설명변수)와 y(종속변수)사이의 관계를 설명해주는 변수
- 기울기는 t-분포를 따른다.
- 귀무가설에서 기울기 = 0을 가정하므로 구할 필요는 없음
- n-2인 이유는 기울기와 절편을 추정하였기 때문이다.
<다중회귀>
<교호작용>
- 종(species) 2개가 영향이 없다면 행이 일자로 나오며, 대각선일 경우 x에 따라 변화되고, x축과 y축에 영향이 있다면 x자의 모양이 된다.
파이썬 실습 -
데이터셋 희망