- 통계학 기초 4 ~ 6 강 수강
- 회귀분석
- 데이터의 분포에 따라 > 독립 변수(X)와 종속 변수(Y) 간의 관계를 모델링. 1차적인 선형 관계인지 고차원적인 그래프의 관계인지에 따라
- 단순 선형 회귀 - 하나의 독립 변수와 하나의 종속 변수의 1차원적인 선형 관계
- 다항 회귀 - 독립 변수와 종속 변수 간의 관계가 선형이 아닐 때 사용
- 다중 선형 회귀 - 두 개 이상의 독립 변수(X1, X2, ..., Xn)와 하나의 종속 변수 간의 관계를 모델링.
- 파이썬에서는 단순 선형 회귀나 다중 선형 회귀, 동일하게 진행하고 X 독립 변수 구조만 다르다, 변수가 여러 개 = X data frame 에 column 이 여러 개.
- 범주형 변수의 경우, pandas의 get_dummies 함수를 활용해 더미 변수를 생성해 선형회귀분석 진행
- 상관 관계 분석
- 마찬가지로 변수 간의 관계에 따라
- 피어슨 상관 계수 - 두 연속형 변수 간 선형 관계 측정
- 비모수 상관 계수 - 데이터가 정규분포를 따르지 않거나 변수들이 순서형 데이터일 때 사용하는 상관계수, 분포에 대한 가정이 없이 상관관계 측정, 스피어만 상관계수와 켄달 타우 상관 계수가 있다.
- ADsP 내용 정리
- 용어 정리 - 엔터티, 속성, 인스턴스
- 정규화 - 제 1, 2, 3 정규화와 그 목적