1. View 함수
- 내장함수
- 오른쪽 환경 창에서
데이터프레임
클릭 > 왼쪽에 데이터 띄워지며 아래 콘솔창에 View(데이터프레임명)
나타남
2. glimpse 함수
- dplyr 패키지의 함수
- row 수, column 수, 각 변수별 타입과 값들 알려주는 함수
3. as factor 함수
- 범주형 척도로 바꾸는 내장함수
- 데이터프레임$변수 입력하면 해당 변수의 타입 반환
3-1. 범주형 척도에서 정렬 순서 변경
데이터프레임명$변수명 <- factor(데이터프레임명$변수명, levels=c( ))
(1) factor() 함수
(2) levels = c( )
- 범주형 척도로 측정된 변수의 정렬 순서(c 안에 정렬된 순서로)
4. str(데이터프레임명) 함수
- glimpse와 비슷, 보기 조금 더 복잡함
- 그러나 범주형 척도(factor)의 범주의 가짓수를 알려줌 (a-b-c, ㄱ-ㄴ-ㄷ, 1-2-3 ... 순서로 숫자를 부여하고(서수), 알려줌)
- NA는 범주의 가짓수에 들어가지 않음
- 변수 하나에 대해서만도 적용 가능 str(데이터프레임명$변수명)
5. summary 함수
- 문자형 함수는 사용 X
- 범주형 척도, 정량적 변수에는 사용 O
- 변수 하나에 대해서만도 적용 가능 summary(데이터프레임명$변수명)
6. 조건문 함수 ifelse
ifelse(조건, 조건을 만족할 경우의 값, 만족하지 않을 경우의 값)
- 범주가 n 개 일 때, ifelse 중첩하여 n-1번 사용
ifelse(조건1, 값1, ifelse(조건2, 값2, ifelse(조건3, 값3, ...)))
7. case_when 함수
case_when(조건 ~ 관측값, 조건 ~ 관측값, ... )
- dplyr 패키지 내의 함수
- ifelse와 비슷하지만 더 간단하게 코드 만들 수 있음 (범주가 여러개일 경우)
- 뒤의 조건들은 앞의 조건을 모두 물고 들어감.
ex) total<10
~"T", total<20
~"S", ... => total<20
은 10<=total<20
이라는 뜻
- 변수 측정값 중 NA가 있다면,
TRUE~
조건은 쓰지 않아야 함
TRUE~
조건 : 제일 마지막에 모든 조건에 그렇지 않은 경우 / NA도 포함되어 잘못된 결과값을 낼 수 있음
8. 데이터프레임 삭제
rm(데이터프레임명)
9. 비율 추출 함수 quantile
quantile(데이터프레임명$변수명, probs= c(비율))