chapter3 D-4 TIL

홍유택·2025년 1월 21일

회귀분석 - 선형회귀

2. 선형회귀의 사례

2.1 몸무게와 키 상관관계를 찾아내기

2.2 Data Scientific 한 발상

3. 선형회귀 이론

3.1 선형회귀 이론

선형회귀 용어 정리

📌 머신이는 몸무게를 알면 키를 알 수 있을 것이라 생각했어요. 이를 이용해서 방정식을 세우고 용어를 정리해볼게요. 통계학과 컴퓨터 공학 두 학문을 바탕으로 발전해와서 같은 원리지만 부르는 명칭이 살짝 달라요! 용어를 정리해볼게요

4. 회귀분석 평가 지표

4.1 회귀분석의 평가지표

☑️ 회귀 평가지표 - MSE

  • 에러 정의방법
    • 방법1) 에러 = 실제 데이터 - 예측 데이터 로 정의하기
    • 방법2) 에러를 제곱하여 모두 양수로 만들기, 다 합치기
    • 방법3) 데이터만큼 나누기
  • 에러 정의 방법 수식화
    • 방법1) ε=yiyi^\varepsilon = y_i - \hat{y_i}
    • 방법2) i=1n(yiyi^)2\sum\limits_{i=1}^n (y_i - \hat{y_i})^2
    • 방법3)

4.2 선형회귀만의 평가 지표 - R Square

  • 기초 용어
    - yiy_{i}: 특정 데이터의 실제 값
    - yˉ\bar{y}: 평균 값
    - y^\hat{y}: 예측, 추정한 값

5. 선형회귀 적용

☑️ 데이터 사이언스 파이썬 라이브러리

  • scikit-learn: Python 머신러닝 라이브러리
  • numpy: Python 고성능 수치 계산을 위한 라이브러리
  • pandas: 테이블 형 데이터를 다룰 수 있는 라이브러리
  • matplotlib: 대표적인 시각화 라이브러리, 그래프가 단순하고 설정 작업 많음
  • seaborn: matplot기반의 고급 시각화 라이브러리, 상위 수준의 인터페이스를 제공

☑️ 자주 쓰는 함수

  • sklearn.linear_model.LinearRegression : 선형회귀 모델 클래스
    • coef_: 회귀 계수
    • intercept: 편향(bias)
    • fit: 데이터 학습
    • predict: 데이터 예측

5.2 (실습) 선형회귀 실습

☑️ 키-몸무게 데이터 실습

  1. 라이브러리설치
  2. 선형회귀 모델 불러오고 훈련하기
  3. 산점도 그리기
  4. 평가
profile
안녕하세요

0개의 댓글