평균과 분산
우리가 문제를 풀면서 접했던 p-value.무슨 의미인지 정확히 알고 있는가?
통계적 가설(귀무가설, 대립가설)
상관관계(방향)와 상관계수(방향, 힘)는 다르다.
모집단의 표준편차가 알려지지 않았을 때,정규분포의 모집단에서 모은 샘플(표본)의 평균값에 대한 가설검정 방법
대부분의 경우 정규분포의 z-test 와 t-test를 단순/별도로 설명하지만 연결해서 볼 필요가 있다.본질적으로는 같기 때문!모집단 <- z-test표본(샘플) <- t-test우리는 모집단을 가지고 테스트를 할 수가 없다.
t-test 적용
Two-sample test, One-sample test, Paired-sample test
ANOVA 기초
F-value 분산 분석
t-test anova 같은 경우 연속형 종속변수, 명목척도(범주형) 독립변수만약 둘다 명목 척도라면? t-test,m ANOVA 못씀이때 사용하는 것이 교차분석변수가 명목척도 일 때,자료의 값은 개수여야함.앞의 t-test나 ANOVA의 경우 둘/셋 이상의 집단의 같
회귀(Regression)이란 말은 어딘가로 돌아간다는 의미어디로 돌아가는걸까?주어진 독립변수로 종속변수를 예측하기 위해단순 회귀(Simple regression)독립변수 1개 / 종속변수 1개다중 회귀(Multiple regression)독립변수 2개 이상 / 종속변
종속변수에 대한 독립변수들의 단위(scaling)을 통일시긴 계수 모든 독립변수를 같은 단위로 상정하고 비교 가능 원점(0,0)을 지나가 절편이 "0"임 해석이 어렵다 여러 독립변수의 상대적 중요도를 비교 가능 표준화 계수의 크기는 별도의 테스트를 해서 크다/작