2. R 기초 예제 - mtcars 데이터 분석

soso·2022년 7월 23일
0

데이터분석

목록 보기
2/2

1. mtcars 데이터 소개

mtcars는 R의 내장데이터 중 하나이다.

1-1. 데이터 구조 확인

str(mtcars)

1-2. 데이터 변수 설명

help(mtcars)


데이터 변수 설명은 help 창에서 확인할 수 있다.

2. 연비(mpg)의 히스토그램 작성

#패키지 설치
install.packages('dplyr')
install.packages('ggplot2')

library(dplyr)
library(ggplot2)

  mtcars %>%
    #그래프 형태 생성
    ggplot(aes(mpg)) + 
    #히스토그램 그리기 위해 도수분포표를 그림
    #color 테두리 fill 색채우기 
    geom_histogram(binwidth = 2, color='black', fill='red',alpha=0.3) + 
    #virtical line 세로 선 hline 가로선 
    #intercept 절편
    geom_vline(aes(xintercept= mean(mpg)),linetype='dashed') + 
    labs(title = "Histogram of mpg", x='mpg(Miles/(US) gallon',y='frequency') 

분포가 왼/오 이질적인 것을 보아 두개의 그룹이 나뉜 다는 것을 예측해볼 수 있음

3. 기어(am) 방식에 따른 연비(mpg)의 평균

  #데이터 객체 생성
  cars <- mtcars 
  #ifelse(조건,T,F) 
  cars$am <- ifelse(cars$am == 0, '자동','수동') 
                                                 
  cars %>%
    group_by(am) %>%
    summarise(연비평균 = mean(mpg)) %>% #mpg 평균 계산
    ggplot(aes(am,연비평균)) + #그래프 축 지정 (데이터 삽입 안된 상태)
    geom_col(fill = c("#FFCC00","#FF6600")) + #막대그래프 함수: geom_col fill == c 색깔 지정해서 채우기
    labs(title = "기어종류에 따른 연비",x="기어종류",y="연비평균") #label 재지정

수동 기어의 연비 평균이 자동 기어의 연비 평균보다 높다는 것을 알 수 있음

profile
공부하는 블로그

0개의 댓글