➖ 하나의 독립 변수 X와 하나의 종속 변수 Y 간의 관계를 직선으로 모델링
[특징]
➖ 독립 변수 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측
➖ 간단하고 해석이 용이함
➖ 데이터가 선형적이지 않을 경우 적합 X
[회귀식]
Y = p0(절편) + p1(기울기)X *p:베타
➖ 두 개 이상의 독립 변수 (X1, X2, ...,Xn)와 하나의 종속 변수 Y 간의 관계를 모델링
[특징]
➖ 여러 독립 변수의 변화를 고려하여 종속 변수를 설명하고 예측
➖ 여러 변수 영향 동시 분석 가능
➖ 변수들 간 다중공선성 문제 발생 가능
❓ 다중공선성: 회귀분석에서 독립 변수들 간 높은 상관관계가 있는 경우
- 개별적 효과 분리 어려워져 회귀의 해석을 어렵게 함
- 중요한 변수가 통계적으로는 유의하지 않게 나올 가능성 O
[회귀식]
Y = p0 + p1X1 + p2X2 +...+ pnXn
➖ 데이터가 훨씬 복잡할 때 사용하는 회귀
[특징]
➖ 독립 변수와 종속 변수 간의 관계가 선형이 아닌 경우 사용
➖ 독립 변수의 다항식을 사용하여 종속 변수 예측
➖ 데이터가 곡선적 경향
➖ 비선형 관계 모델링 가능
➖ 고차 다항식의 경우 과적합(overfitting) 위험 O
➖ 독립 변수의 구간별로 다른 회귀식 적용하여 복잡한 관계 모델링
[특징]
➖ 구간마다 다른 다항식 사용
➖ 매끄러운 곡선 생성하여 복잡한 비선형 관계 유연하게 모델링 가능
➖ 적절한 매듭점 선택 중요