1112_TIL

황지호·2024년 11월 12일

- 통계학 기초 4 ~ 6 강 수강

  • 회귀분석
    • 데이터의 분포에 따라 > 독립 변수(X)와 종속 변수(Y) 간의 관계를 모델링. 1차적인 선형 관계인지 고차원적인 그래프의 관계인지에 따라
        1. 단순 선형 회귀 - 하나의 독립 변수와 하나의 종속 변수의 1차원적인 선형 관계
        1. 다항 회귀 - 독립 변수와 종속 변수 간의 관계가 선형이 아닐 때 사용
        1. 다중 선형 회귀 - 두 개 이상의 독립 변수(X1, X2, ..., Xn)와 하나의 종속 변수 간의 관계를 모델링.
    • 파이썬에서는 단순 선형 회귀나 다중 선형 회귀, 동일하게 진행하고 X 독립 변수 구조만 다르다, 변수가 여러 개 = X data frame 에 column 이 여러 개.
    • 범주형 변수의 경우, pandas의 get_dummies 함수를 활용해 더미 변수를 생성해 선형회귀분석 진행
  • 상관 관계 분석
    • 마찬가지로 변수 간의 관계에 따라
        1. 피어슨 상관 계수 - 두 연속형 변수 간 선형 관계 측정
        1. 비모수 상관 계수 - 데이터가 정규분포를 따르지 않거나 변수들이 순서형 데이터일 때 사용하는 상관계수, 분포에 대한 가정이 없이 상관관계 측정, 스피어만 상관계수와 켄달 타우 상관 계수가 있다.

- ADsP 내용 정리

  • 용어 정리 - 엔터티, 속성, 인스턴스
  • 정규화 - 제 1, 2, 3 정규화와 그 목적
profile
안녕하세요

0개의 댓글