선형회귀의 확장
다중회귀
설명변수가 여러 개인 회귀
편회귀계수
범주형 변수를 설명변수로
각 범주에 대해 가변수로 0 또는 1을 할당하고 회귀모형에 적용
공분산분석
고차원 데이터 문제
다중공선성
- 설명변수가 여러 개인 다중회귀에서 설명변수 사이에 강한 상관이 있는 경우, 다중공선성이 있다고 말한다.
- 다중공선성이 있다면 회귀계수의 추정오차가 커지는 문제가 발생할 가능성이 있다.
상호작용
설명변수 간의 상승효과, 선형회귀모형 안에서 곱셈 cx_ix_j로 나타낼 수 있다
이원배치 분산분석
다중배치 분산분석: 여러 개의 요인을 동시에 고려할 수 있는 분산분석
비선형회귀
선형회귀 원리 확장하기
가능도와 최대가능도 방법
'확률적으로 얼마나 나타나기 쉬운가'
로지스틱 회귀
일반화선형모형의 일종
범주 하나가 일어날 확률을 p로 두고, 설명변수 x가 바뀌었을 때 p가 얼마나 달라지는지를 조사
p는 이항분포
로지스틱 함수
f(x)
-정의역: 무한, 치역: [0,1]
-a: 평행이동, b: 변화정도
로짓 함수: 아래 식의 우변
오즈비
푸아송 회귀