- ggplot2 패키지 설치 및 불러오기
- ggplot2 실습
- airqaulity data set을 사용한다.
airquality(data set, aes(데이터 속성))
x 축은 day, y 축은 temp로 맵핑
geom_point() 함수를 이용해 산점도로 값을 표시한다.
geom_point의 크기와 색깔을 설정해 가시성을 높인다.
geom_line() 함수를 이용해 꺽은선 그래프로 값을 표시한다.
꺽은선 그래프에 선전도를 추가한다.
그래프에 크기와 색깔을 설정해 가시성을 높인다.
boxplot() 함수를 이용해 상자 그래프로 값을 표시한다.
ggplot(airquality, aes(x= Temp))로 설정하고 geom_histogram()함수를 이용해 히스토그램으로 값을 표시한다.
- mtcars data set을 사용한다.
x 축을 cyl로 맵핑한다.
geom_bar() 함수를 이용해 막대그래프로 값을 표시한다.
막대그래프 넓이를 설정한다.
factor() 함수를 이용하면 비어있는 범주를 제외하고 시각화한다.
geom_bar(aes(fill=factor()))을 사용해 누적 막대그래프로 값을 표시한다.
+coord_polar()를 추가해 선버스트로 표현할 수 있다.
+coord_polar(theta="y")를 추가해 원형그래프 함수로 표현할 수 있다.
economics data set을 사용한다.
ggplot(econmics, aes(x= date, y= psavert))로 설정한다.
geom_line() 함수를 이용해 꺽은선그래프로 표현한다.
회귀분석으로 절편과 기울기를 구한다.
intercept(절편) = 12.4117258 , slope(기울기) = -0.0004925
geom_abline(intercept = , slope = ) 함수를 이용해 사선 그래프 추세를 표현한다.
mean() 함수를 이용해 psarvert 값의 평균을 구한다.
geom_hline() 함수를 이용해 수평선을 표현한다.
min() 함수를 이용해 psarvert 값이 가장 낮은 날짜를 구한다.
geom_vline() 함수를 이용해 수직선을 표현한다.
날짜를 직접 입력할 수 있는데, 문자데이터를 날짜로 바꿀 때는 as.Date()를 사용한다.
텍스트 입력 및 도형 그리기
geom_text(aes(label = 라벨명, vjust = 세로위치, hjust = 가로위치) 함수를 이용해 값을 표현한다.
vjust / hjust 값 0은 데이터 오른쪽 위, + 값은 아래/왼쪽, - 값은 위/오른쪽에 표시한다.
annotate("모양", xmin = x축 시작값, xmax = x축 끝값, ymin = y축 시작값, ymax = y축 끝값) 함수를 이용해 데이터를 강조한다.
alpha와 fill 조건을 추가해 투명도와 색깔을 설정한다.
"segment"를 입력하고 arrow() 함수를 옵션을 추가해 화살표로 선을 표현한다.
"text"를 입력해 label를 표현한다.
제목을 추가하고 디자인 테마 설정
labs(x = "x축 이름", y = "y축 이름", title = "그래프 제목")
theme() 함수를 이용해 테마를 변경할 수 있다.
theme_bw()
theme_gray()
theme_linedraw()
theme_light(), theme_dark(), theme_minimal(), theme_void(), theme_classic() 등 다양한 테마가 있다.
[출처] 처음 시작하는 R데이터 분석, 강전희