정상 범주에서 크게 벗어난 값
table(데이터프레임$확인할변수명)
outlier$score <- ifelse(outlier$score == 이상값, NA, outlier$score)
outlier %>%
filter(!is.na(sex) & !is.na(score)) %>%
group_by(sex) %>%
summarise(mean_score = mean(score))
논리적으로 존재할 수는 있으나 극단적으로 크거나 작은 값
boxplot(mpg$hwy)
boxplot(mpg$hwy)$stats
-- 결과
[,1]
[1,] 12 # 아래쪽 극단치 경계
[2,] 18 # 1사분위 수
[3,] 24 # 중앙값
[4,] 27 # 3사분위 수
[5,] 37 # 위쪽 극단치 경계
attr(,"class")
1
"integer"
mpg$hwy <- ifelse(mpg$hwy < 12 | mpg$hwy > 37, NA, mpg$hwy)
table(is.na(mpg$hwy))
-- 결과
FALSE TRUE
231 3
mpg %>%
group_by(drv) %>%
summarise(mean_hwy = mean(hwy, na.rm = T))