[통계학] 통계야 놀자 04 내용 정리
회귀분석
1. 회귀분석
2. 회귀분석의 특징, 종류
3. 정합성 검증 & 결과 해석
1. 회귀분석이란?
2. 회귀분석의 특징, 종류
1) 특징
- 장점
- 친밀성 : 예측문제 해결에서 가장 많이 사용되고 있는 방법으로 분석 및 해석 방법이 다수 존재
- 유용성 : 결과에 대한 근거, 이유, 활용방안 등 정보를 얻는데 유용
- 유연성 : 종속변수를 설명하기 위한 다양한 독립변수를 선택하고 실험 가능
- 단점
- 복잡성 : 기본 가정이 어긋나면 회귀분석을 사용할 수 없음
- 한계성 : 비선형성 확인을 위한 적절한 방식이 존재하지 않음
2) 종류
3. 정합성 검증 & 결과 해석
1) 회귀모델(회귀식)이 얼마나 설명력을 갖는가?
- 결정계수 R_squared(R²)를 확인
- 결정계수 : 종속변수와 독립변수의 관계를 나타내는 수치
2) 회귀모델(회귀식)이 통계적으로 유의한지
- 회귀식에 대한 F검정 시행
- p-value로 유의성 판단 ( 기준 : 0.05 )
3) 독립변수와 종속변수 간 선형관계 여부
- 회귀식의 기울기에 대한 t 검정시헝
- p-value로 유의성 판단 ( 기준 : 0.05 )
4) OLS(ordinary Least Squares) 해석
- summary 함수를 활용
- 주요 지표
- Dep. Variable (y) : 종속변수
- R-squared () : 결정계수
- F-statistic () : F-검정 통계량
- Prob(F-statistic) () : F-검정의 p-값
- coef ()
- const () : 상수항 ( 절편 )
- x1 () : 회귀 계수, 기울기
- std err () : 회귀 계수 추정치의 표준 오차
- t : t 검정 값
- P>|t| : t 검정의 p-값
- [0.025 0.975] : 회귀 계수에 대한 95% 신뢰구간