누락된 값, 비어 있는 값 의미
NA
로 표기is.na(변수명)
으로 결측치 확인
TRUE
FALSE
table(is.na(변수))
형태로 사용하면 개수 출력
결측치는 데이터 프레임 전체가 아닌, 개별 변수마다 확인해야 함
is.na(데이터프레임$확인할변수)
형태로 사용결측치가 포함된 데이터에 함수 적용하면 NA
출력
한 번에 제거는 na.omit()
함수 사용
mean()
등의 수치 연산 함수는 결측치를 제외하고 연산 수행하는 na.rm
파라미터를 지원
na.rm
을 TRUE
로 설정하면 결측치를 제외하고 함수를 적용na.rm
을 적용하진 X → 적용 안 될 경우 filter()
로 제거한 후 적용데이터프레임[c(행), "변수명"] <- NA
mean(데이터프레임$변수명, na.rm=T)
NA
값을 평균값으로 대체df$변수 <- ifelse(is.na(df$변수), 평균값, df$math)