
결측값, 이상값 제거
변수선택, 차원축소, 파생변수 생성등
reshape 패키지 : melt(), cast() or dcast()
melt() : 원데이터 형태로 만드는 함수cast() : 요약 형태로 만드는 함수
sqldf 패키지 : R에서 SQL 명령어 사용 가능하게 해주는 패키지
plyr 패키지 : Data 분할, 재결합 처리하는 패키지
ddply() : 데이터 프레임 내에 그룹 별로 특정한 함수를 적용한 데이터 분석을 하는 함수
data.table 패키지 : data.frame과 달리 인덱스를 지정하여 속도가 월등히 빠르다



단순 랜덤 추출(Simple Random Sampling) : 임의의 n개 추출하는 방법
계통추출법(Systematic Sampling) : K개씩 n개의 구간으로 나누는 방법

집락추출법(Cluster Random Sampling)

층화추출법


확률 :
확률변수 : 인 함수
조건부 확률 :
독립사건 :
배반사건 :


귀무가설(Null Hypothesis, )
대립가설(Alternative Hypothesis, )
검정통계량(Test Statistic)
유의수준(Significance level)

유의확률(Significance Probability, p-value)
기각역(Critical region)

1종오류,2종오류