[R] 데이터 전처리

imacusirius·2021년 8월 6일
0

R

목록 보기
10/16

데이터 전처리

분석에 적합하게 데이터를 가공하는 작업

패키지 dplyr

  • %>% 기호 이용해 함수 나열
dplyr 함수기능
filter()행 추출
select()열 추출
arrange()정렬
mutate()변수 추가
summarise()통계치 산출
group_by()집단별 나누기
left_join()데이터 합치기(열)
bind_rows()데이터 합치기(행)

filter() - 조건에 맞는 데이터만 추출

변수명 %>% filter(조건)

select() - 필요한 변수 추출

변수명 %>% select(추출할변수)
# 제외
변수명 %>% select(-제외할변수)

arrange() - 정렬

# 오름차순
변수명 %>% arrange(기준변수)

#내림차순
변수명 %>% arrange(desc(기준변수))

mutate() - 파생변수 추가

변수명 %>%
  mutate(생성할변수명 = 파생변수조건)

group_by(), summarise() - 집단 요약

변수 %>%
  group_by(기준) %>%
  summarise(새변수 = 조건)

left_join(), bind_rows() - 데이터 병합

# 가로
변수 <- left_join(변수1, 변수2, by="기준")
# 세로, 변수명 통일 필요
변수 <- bind_rows(변수, 변수)

0개의 댓글