[스터디_R] ggplot2 패키지

Brad Pitt·2022년 6월 5일
0
  1. ggplot2 패키지 설치 및 불러오기

  1. ggplot2 실습
  • airqaulity data set을 사용한다.
  • airquality(data set, aes(데이터 속성))

  • x 축은 day, y 축은 temp로 맵핑

  • geom_point() 함수를 이용해 산점도로 값을 표시한다.

  • geom_point의 크기와 색깔을 설정해 가시성을 높인다.

  • geom_line() 함수를 이용해 꺽은선 그래프로 값을 표시한다.

  • 꺽은선 그래프에 선전도를 추가한다.

  • 그래프에 크기와 색깔을 설정해 가시성을 높인다.

  • boxplot() 함수를 이용해 상자 그래프로 값을 표시한다.

  • ggplot(airquality, aes(x= Temp))로 설정하고 geom_histogram()함수를 이용해 히스토그램으로 값을 표시한다.

  • mtcars data set을 사용한다.
  • x 축을 cyl로 맵핑한다.

  • geom_bar() 함수를 이용해 막대그래프로 값을 표시한다.

  • 막대그래프 넓이를 설정한다.

  • factor() 함수를 이용하면 비어있는 범주를 제외하고 시각화한다.

  • geom_bar(aes(fill=factor()))을 사용해 누적 막대그래프로 값을 표시한다.

  • +coord_polar()를 추가해 선버스트로 표현할 수 있다.

  • +coord_polar(theta="y")를 추가해 원형그래프 함수로 표현할 수 있다.

economics data set을 사용한다.

  • ggplot(econmics, aes(x= date, y= psavert))로 설정한다.

  • geom_line() 함수를 이용해 꺽은선그래프로 표현한다.

  • 회귀분석으로 절편과 기울기를 구한다.

  • intercept(절편) = 12.4117258 , slope(기울기) = -0.0004925

  • geom_abline(intercept = , slope = ) 함수를 이용해 사선 그래프 추세를 표현한다.

  • mean() 함수를 이용해 psarvert 값의 평균을 구한다.

  • geom_hline() 함수를 이용해 수평선을 표현한다.

  • min() 함수를 이용해 psarvert 값이 가장 낮은 날짜를 구한다.

  • geom_vline() 함수를 이용해 수직선을 표현한다.

  • 날짜를 직접 입력할 수 있는데, 문자데이터를 날짜로 바꿀 때는 as.Date()를 사용한다.

텍스트 입력 및 도형 그리기

  • geom_text(aes(label = 라벨명, vjust = 세로위치, hjust = 가로위치) 함수를 이용해 값을 표현한다.

  • vjust / hjust 값 0은 데이터 오른쪽 위, + 값은 아래/왼쪽, - 값은 위/오른쪽에 표시한다.

  • annotate("모양", xmin = x축 시작값, xmax = x축 끝값, ymin = y축 시작값, ymax = y축 끝값) 함수를 이용해 데이터를 강조한다.

  • alpha와 fill 조건을 추가해 투명도와 색깔을 설정한다.

  • "segment"를 입력하고 arrow() 함수를 옵션을 추가해 화살표로 선을 표현한다.

  • "text"를 입력해 label를 표현한다.

제목을 추가하고 디자인 테마 설정

  • labs(x = "x축 이름", y = "y축 이름", title = "그래프 제목")

  • theme() 함수를 이용해 테마를 변경할 수 있다.

  • theme_bw()

  • theme_gray()

  • theme_linedraw()

  • theme_light(), theme_dark(), theme_minimal(), theme_void(), theme_classic() 등 다양한 테마가 있다.

[출처] 처음 시작하는 R데이터 분석, 강전희

profile
데이터는 철저하게 해석은 자유롭게

0개의 댓글

관련 채용 정보