샘플링 : 표본추출을 의미, 모집단 전체에 대한 추정치(estimate)을 얻기 위해 모집단에서 임의의 sample을 뽑아내는 것.모집단 전체에 대한 조사는 사실상 불가능하기 때문에, 샘플을 이용하여 모집단에 대한 추론(inference)을 하게 되는 것.\- ex)
확률 밀도 추정이란? 관측된 데이터로부터 변수가 가질 수 있는 모든 값의 확률을 추정하는 것.확률 밀도 추정 방법은 Parametric과 Non-parametric 두 가지 방법으로 구분할 수 있다.관측된 데이터를 바탕으로 관심 대상인 확률 변수가 특정 분포를 따른다
target distribution을 stationary distribution으로 가지는 마코프 체인을 만드는 과정 \- MCMC는 초기값에 영향을 받기 때문에 burn-in-time을 지나고 나면 target distribution을 따르는 샘플이 생성Monte C
유의차 분석 : 데이터의 평균 or 비율 등의 차이가 통계적으로 의미가 있는지, 통계 모형을 사용하여 검정(test)하는 분석 기법.통계학에서 두 그룹 군의 차이를 비교하고자 할 때, 통계적 유의차가 있는지 확인하는 과정을 통틀어 유의차 분석이라고 함. 제조업의 경우에
R-Square를 test set의 평가지표로 사용할 수 없는 이유 회귀모델에서 최소제곱법은 train set 내에서 SSE가 최소가 되도록 회귀계수를 추정하는 방식이다. 이 과정에서 잔차의 합은 0이 되며 ($\sum r_i = 0$), $R^2$ = 1 - $\f