[내일배움캠프] 통계학 기초 (7)

셔닝🧸·2025년 7월 7일
0

오늘의 학습

  1. 단순선형회귀
  2. 다중선형회귀
  3. 다항회귀
  4. 스플라인 회귀

  1. 단순선형회귀

➖ 하나의 독립 변수 X와 하나의 종속 변수 Y 간의 관계를 직선으로 모델링

[특징]

➖ 독립 변수 변화에 따라 종속 변수가 어떻게 변화하는지 설명하고 예측
➖ 간단하고 해석이 용이함
➖ 데이터가 선형적이지 않을 경우 적합 X

[회귀식]

Y = p0(절편) + p1(기울기)X *p:베타


  1. 다중선형회귀

➖ 두 개 이상의 독립 변수 (X1, X2, ...,Xn)와 하나의 종속 변수 Y 간의 관계를 모델링

[특징]

➖ 여러 독립 변수의 변화를 고려하여 종속 변수를 설명하고 예측
➖ 여러 변수 영향 동시 분석 가능
➖ 변수들 간 다중공선성 문제 발생 가능

❓ 다중공선성: 회귀분석에서 독립 변수들 간 높은 상관관계가 있는 경우

  • 개별적 효과 분리 어려워져 회귀의 해석을 어렵게 함
  • 중요한 변수가 통계적으로는 유의하지 않게 나올 가능성 O

[회귀식]

Y = p0 + p1X1 + p2X2 +...+ pnXn


  1. 다항회귀

➖ 데이터가 훨씬 복잡할 때 사용하는 회귀

[특징]

➖ 독립 변수와 종속 변수 간의 관계가 선형이 아닌 경우 사용
➖ 독립 변수의 다항식을 사용하여 종속 변수 예측
➖ 데이터가 곡선적 경향
➖ 비선형 관계 모델링 가능
➖ 고차 다항식의 경우 과적합(overfitting) 위험 O


  1. 스플라인 회귀

➖ 독립 변수의 구간별로 다른 회귀식 적용하여 복잡한 관계 모델링

[특징]

➖ 구간마다 다른 다항식 사용
➖ 매끄러운 곡선 생성하여 복잡한 비선형 관계 유연하게 모델링 가능
➖ 적절한 매듭점 선택 중요

profile
어떻게든 하겠숴여...❕

0개의 댓글