[R] 여러가지 함수

주연쓰·2023년 4월 21일
0

[R] 데이터분석

목록 보기
2/17
post-thumbnail

1. View 함수

  • 내장함수
  • 오른쪽 환경 창에서 데이터프레임 클릭 > 왼쪽에 데이터 띄워지며 아래 콘솔창에 View(데이터프레임명) 나타남

2. glimpse 함수

  • dplyr 패키지의 함수
  • row 수, column 수, 각 변수별 타입과 값들 알려주는 함수

3. as factor 함수

  • 범주형 척도로 바꾸는 내장함수
  • 데이터프레임$변수 입력하면 해당 변수의 타입 반환

3-1. 범주형 척도에서 정렬 순서 변경

데이터프레임명$변수명 <- factor(데이터프레임명$변수명, levels=c( ))

(1) factor() 함수

  • 척도를 범주형으로 바꿈

(2) levels = c( )

  • 범주형 척도로 측정된 변수의 정렬 순서(c 안에 정렬된 순서로)

4. str(데이터프레임명) 함수

  • glimpse와 비슷, 보기 조금 더 복잡함
  • 그러나 범주형 척도(factor)의 범주의 가짓수를 알려줌 (a-b-c, ㄱ-ㄴ-ㄷ, 1-2-3 ... 순서로 숫자를 부여하고(서수), 알려줌)
  • NA는 범주의 가짓수에 들어가지 않음
  • 변수 하나에 대해서만도 적용 가능 str(데이터프레임명$변수명)
    변수 하나에 대해서 적용

5. summary 함수

  • 문자형 함수는 사용 X
  • 범주형 척도, 정량적 변수에는 사용 O
  • 변수 하나에 대해서만도 적용 가능 summary(데이터프레임명$변수명)

6. 조건문 함수 ifelse

ifelse(조건, 조건을 만족할 경우의 값, 만족하지 않을 경우의 값)

  • 범주가 n 개 일 때, ifelse 중첩하여 n-1번 사용
    ifelse(조건1, 값1, ifelse(조건2, 값2, ifelse(조건3, 값3, ...)))

7. case_when 함수

case_when(조건 ~ 관측값, 조건 ~ 관측값, ... )

  • dplyr 패키지 내의 함수
  • ifelse와 비슷하지만 더 간단하게 코드 만들 수 있음 (범주가 여러개일 경우)
  • 뒤의 조건들은 앞의 조건을 모두 물고 들어감.
    ex) total<10~"T", total<20~"S", ... => total<2010<=total<20 이라는 뜻
  • 변수 측정값 중 NA가 있다면, TRUE~ 조건은 쓰지 않아야 함
    TRUE~ 조건 : 제일 마지막에 모든 조건에 그렇지 않은 경우 / NA도 포함되어 잘못된 결과값을 낼 수 있음

8. 데이터프레임 삭제

rm(데이터프레임명)

9. 비율 추출 함수 quantile

quantile(데이터프레임명$변수명, probs= c(비율))

profile
( •̀ ω •́ )✧

0개의 댓글