회귀분석

장정근·2025년 4월 9일

회귀분석이란 하나 이상의 독립 변수(X)를 사용해서 종속 변수(Y)를 예측하는 통계적 기법
어떠한 변수들이 결과값에 어떤 영향을 미치는지 알아보고 싶을 때 사용하는 분석


독립 변수 : 예측에 사용하는 변수(공부시간, 잠자는 시간 등)
종속 변수 : 예측하고자 하는 변수(시험 점수, 판매량 등)


회귀분석 종류

단순 선형 회귀 : 독립 변수 1개와 종속 변수 1개 간의 관계 분석
다중 선형 회귀 : 독립 변수 여러 개로 종속 변수 1개를 예측
로지스틱 회귀 : 종속 변수가 범주형일 때 사용(합격/불합격)


단순 선형 회귀 예시

공부 시간으로 시험 점수를 예측한다고 했을 때,
모델 식

Y : 시험 점수
X : 공부시간
𝛽0 : 절편(공부 안 했을 때의 예상 점수)
𝛽1 : 공부시간이 점수에 미치는 영향
ϵ : 오차


회귀분석의 목적

  1. 예측 : 미래의 값을 예측한다
  2. 설명 : 어떤 요인이 결과에 영향을 미치는 지 파악
  3. 변수 선택 : 중요한 변수 찾기

회귀분석의 용어

R^2(결정계수) : 모델이 데이터를 얼마나 잘 설명하는지 나타냄(0~1사이)
p-value : 회귀계수가 통계적으로 유의미한지 여부 확인

0개의 댓글