결측값, 이상값 제거
변수선택, 차원축소, 파생변수 생성등
reshape
패키지 : melt()
, cast()
or dcast()
melt()
: 원데이터 형태로 만드는 함수cast()
: 요약 형태로 만드는 함수sqldf
패키지 : R에서 SQL 명령어 사용 가능하게 해주는 패키지
plyr
패키지 : Data 분할, 재결합 처리하는 패키지
ddply()
: 데이터 프레임 내에 그룹 별로 특정한 함수를 적용한 데이터 분석을 하는 함수data.table
패키지 : data.frame
과 달리 인덱스를 지정하여 속도가 월등히 빠르다
단순 랜덤 추출(Simple Random Sampling) : 임의의 n개 추출하는 방법
계통추출법(Systematic Sampling) : K개씩 n개의 구간으로 나누는 방법
집락추출법(Cluster Random Sampling)
층화추출법
확률 :
확률변수 : 인 함수
조건부 확률 :
독립사건 :
배반사건 :
귀무가설(Null Hypothesis, )
대립가설(Alternative Hypothesis, )
검정통계량(Test Statistic)
유의수준(Significance level)
유의확률(Significance Probability, p-value)
기각역(Critical region)
1종오류,2종오류