
ggplot(no_sports_cars) +
geom_point(aes(x = cty, y = hwy, color = as.factor(cyl)))
no_sports_cars |>
filter(cty < 10 | cty > 32.5) |>
relocate(cty, .after = year) |>
relocate(hwy, .before = cyl)
ggplot(no_sports_cars) +
geom_point(mapping = aes(x = cty, y = hwy, color = as.factor(cyl)),
position = "jitter")
ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cty))
ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cty)) +
scale_color_gradient(low = "yellow3", high="blue")
이 코드는 ggplot2와 dplyr 패키지를 활용하여 다양한 방식으로 데이터를 시각화하고 변형하는 방법을 보여줍니다. 아래에서 각 부분을 단계별로 설명합니다.
cty)와 고속도로 연비(hwy)를 실린더 수로 색상 구분ggplot(no_sports_cars) +
geom_point(aes(x = cty, y = hwy, color = as.factor(cyl)))
aes(x = cty, y = hwy):cty).hwy).color = as.factor(cyl):cyl)를 범주형(factor)으로 변환하여 색상으로 구분.no_sports_cars |>
filter(cty < 10 | cty > 32.5) |>
relocate(cty, .after = year) |>
relocate(hwy, .before = cyl)
filter(cty < 10 | cty > 32.5):cty)가 10 미만이거나 32.5 초과인 행만 필터링.relocate(cty, .after = year):cty 열을 year 열 바로 뒤로 이동.relocate(hwy, .before = cyl):hwy 열을 cyl 열 바로 앞에 위치시킴.position = "jitter"로 데이터 점의 중첩 방지ggplot(no_sports_cars) +
geom_point(mapping = aes(x = cty, y = hwy, color = as.factor(cyl)),
position = "jitter")
position = "jitter":cty 값으로 색상 구분ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cty))
color = cty:cty) 값으로 지정.cty는 연속형 변수이므로 색상이 그라데이션 형태로 표현됨.displ)과 고속도로 연비(hwy)의 관계를 나타내며, 도시 연비(cty)가 높고 낮음에 따라 색상이 점진적으로 변함.ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cty)) +
scale_color_gradient(low = "yellow3", high = "blue")
scale_color_gradient():cty)의 색상 범위를 사용자 지정.low = "yellow3": 낮은 값은 노란색 계열.high = "blue": 높은 값은 파란색 계열.cyl)를 범주형으로 처리하여 색상 구분하거나, cty를 연속형으로 처리하여 그라데이션으로 표현.filter()로 조건에 맞는 행을 필터링하고, relocate()로 열의 순서를 재배치.position = "jitter"를 통해 점의 중첩을 방지하고, scale_color_gradient()로 색상 표현을 커스터마이징.