
no_sports_cars <- no_sports_cars |>
mutate(japanese_make =
manufacturer %in% c("honda", "nissan", "subaru", "toyota"))
ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = japanese_make))
ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cyl))
ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = as.factor(cyl)))
이 코드에서는 no_sports_cars 데이터를 변형하고 다양한 방식으로 시각화하는 과정을 보여줍니다. 각 부분을 순서대로 설명하겠습니다.
no_sports_cars <- no_sports_cars |>
mutate(japanese_make =
manufacturer %in% c("honda", "nissan", "subaru", "toyota"))
mutate(): 데이터에 새로운 변수를 추가하거나 기존 변수를 수정하는 함수.manufacturer %in% c("honda", "nissan", "subaru", "toyota"):manufacturer(제조사)가 "honda", "nissan", "subaru", "toyota" 중 하나인 경우 TRUE, 그렇지 않으면 FALSE.japanese_make:TRUE 또는 FALSE).ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = japanese_make))
color = japanese_make:japanese_make 변수(TRUE 또는 FALSE)에 따라 다르게 설정.displ)과 고속도로 연비(hwy)의 관계를 나타내는 산점도.TRUE)과 비일본 제조사 차량(FALSE)을 색상으로 구분.ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = cyl))
color = cyl:cyl 변수(실린더 수)에 따라 다르게 설정.cyl은 숫자형 변수이므로, 색상이 연속형으로 표시됨(그라데이션).ggplot(data = no_sports_cars) +
geom_point(mapping = aes(x = displ, y = hwy, color = as.factor(cyl)))
as.factor(cyl):cyl 변수를 범주형(factor)으로 변환.color = as.factor(cyl):japanese_make:TRUE, FALSE)를 이진 값으로 구분한 시각화.cyl (숫자형):as.factor(cyl) (범주형):mutate()를 사용하여 데이터를 변형하고, 논리형 변수(japanese_make)를 추가.color 매핑에서 변수를 숫자형과 범주형으로 처리해 색상을 다르게 표현.