1) iris 데이터의 기본 통계량을 확인할 때 summary 함수 사용
summary(iris) # 컬럼별 통계치 확인
2) iris 데이터의 기본 구조를 확인하는 glimpse 함수 사용
install.packages("dplyr")
library(dplyr)
glimpse(iris) # dplyr 패키지 : 데이터 구조 확인
3) iris 데이터의 기본 구조를 확인하는 str 함수 사용
str(iris) # 데이터 구조 확인
4) data 의 빈도를 표시할때 사용하는 table 함수 사용
table(iris$Sepal.Width)
table(iris$Sepal.Width, iris$Species)
5) data 의 문자열의 고유값을 확인하는 unique 함수 사용
unique(iris$Species)
unique(subset.data.frame(iris, select = c("Sepal.Width","Species" )))
6) data의 오름차순 정렬 ( sort vs order )
# 값의 오름차순 정렬 : sort(데이터)
sort(table(iris$Sepal.Width))
head(iris)
order(iris$Petal.Length)
head(iris[order(iris$Petal.Length),])
head(iris[order(iris$Petal.Length, decreasing=T),])
7) data의 일부 열만 추출하는 subset 함수 사용
subset.data.frame(iris, select = c("Petal.Length","Sepal.Width"))
Raw data의 5개의 column중 2개의 column을 원하는 순서에 맞게 추출이 가능하다.
# 조건에 만족하는 데이터프레임 추출 :
subset.data.frame(iris, subset = c(Petal.Length>1.5))