통계적 회귀

JERRY·2025년 4월 6일

Machine Learning

목록 보기
12/31
post-thumbnail

통계적 회귀

필요한 모듈 import 후 데이터 로드

현재 컬럼 확인 후 불필요한 컬럼 삭제

컬럼별 boxplot

pairplot으로 경향 확인

큰 상관관계를 보이는 멤버쉽 유지 기간을 lmplot으로 확인

멤버쉽 유지기간 통계적 회귀

• R-squared : 모형 적합도, y의 분산을 각각의 변수들이 약 99.8%로 설명할 수 있음
• Adj. R-squared : 독립변수가 여러 개인 다중회귀분석에서 사용
• Prob. F-Statistic : 회귀모형에 대한 통계적 유의미성 검정.
이 값이 0.05 이하라면 모집단에서도 의미가 있다고 볼 수 있음

회귀 모델을 그려보자

이번에는 참 값 vs 예측 값을 그려보자

상수항이 없음

상수항을 넣고 다시 모델 fit

선형 회귀 결과

참 값 vs 예측 값

이번에는 데이터 분리 후 네 개 컬럼 모두를 변수로 보고 회귀

이번에도 참 값. vs 예측 값

0개의 댓글