확보한 데이터를 Pre-processing(전처리)하기도 전에 데이터의 구조를 이해하는 과정이 필요하다.
★ [학습목표]
데이터의 구조를 확인하는 방법과 여러가지 데이터 타입(Tibble)을 데이터 분석에 용이한 data.frame을 형식을 변경하는 방법을 이해한다.
# ggplot2
install.packages("ggplot2")
library(ggplot2) # library load
# mpg데이터 -> 데이터프레임으로 변형하기
mpg.df <- as.data.frame(ggplot2::mpg)
mpg.df # 데이터프레임으로 저장된 데이터 전체 확인
※ 주의 ※ 처리해야 하는 데이터의 type과 Size를 모르기 때문에 전체 데이터 호출은 head(data)명령을 통해 일부의 데이터만 확인하는 작업을 선행하는 것을 추천함.
head(mpg.df) # 데이터의 크기를 모르기 때문에 상위 몇개의 데이터만 확인
tail(mpg.df)
View(mpg.df) # Table 형태로 확인
dim(mpg.df)
str(mpg.df) # Data의 구조를 확인
mp.df
summary(mpg) # Data의 통계치 제공
dim(mpg.df) # Data의 차원을 확인
str(mpg.df) # Data의 구조를 확인
summary(mpg) # Data의 통계치 제공