★ [학습목표]
정규화(Normalization)와 표준화(Standardizaion)의 개념을 이해한다.
# 데이터셋 생성
data <- c(10, 20, 30, 40, 50)
# 정규화
normalized_data <- (data - min(data)) / (max(data) - min(data))
# 표준화
standardized_data <- (data - mean(data)) / sd(data)
# 결과 출력
print("정규화된 데이터:")
print(normalized_data)
print("표준화된 데이터:")
print(standardized_data)
# 필요한 라이브러리 로드
library(ggplot2)
# 데이터셋 생성
set.seed(123)
data <- data.frame(
Original = rnorm(100, mean = 50, sd = 10)
)
# 정규화
data$Normalized <- (data$Original - min(data$Original)) / (max(data$Original) - min(data$Original))
# 표준화
data$Standardized <- (data$Original - mean(data$Original)) / sd(data$Original)
# 도표 생성
ggplot(data) +
geom_histogram(aes(x = Original, y = ..density..), binwidth = 1, fill = "blue", alpha = 0.5) +
geom_histogram(aes(x = Normalized, y = ..density..), binwidth = 0.05, fill = "green", alpha = 0.5) +
geom_histogram(aes(x = Standardized, y = ..density..), binwidth = 0.5, fill = "orange", alpha = 0.5) +
labs(title = "Original, Normalized, and Standardized Data Distributions", x = "Value", y = "Density") +
theme_minimal()