1) 명목척도 변수인 학교유형(type), 합격여부(pass)변수에 대해 빈도분석을 수행하고 결과를
막대 그래프와 파이 차트로 시각화
2) 비율척도 변수인 나이 변수에 대해 요약치(평균, 표준편차)와 비대칭도(왜도와 첨도)
통계량을 구하고, 히스토그램을 작성하여 비대칭도 통계량 설명
3) 나이 변수에 대한 밀도분포 곡선과 정규분포 곡선으로 정규분포 검정
# 1
setwd("C:/Rwork/")
data <- read.csv("dataset2/descriptive.csv", header = TRUE)
head(data)
data
# 1 - 1)
data$type2[data$type == 1] <- "a"
data$type2[data$type == 2] <- "b"
x <- table(data$type2)
y <- prop.table(x)
round(y * 100, 2)
barplot(y)
pie(y)
data$pass2[data$pass == 1] <- "합격"
data$pass2[data$pass == 2] <- "실패"
x1 <- table(data$pass2)
y1 <- prop.table(x1)
round(y1 * 100, 2)
barplot(y1)
pie(y)
# 1 - 2)
plot(data$age)
data <- subset(data, data$age >= 0 & data$age <= 110)
x <- data$age
mean(x)
sd(x)
library(moments)
age <- data$age
skewness(age)
kurtosis(age)
hist(age)
# 1 - 3)
hist(age, probability = T, main = "hello")
lines(density(age), col = 'Maroon 1')
x <- seq(1, 30, 1)
curve(dnorm(x, mean(age), sd(age)), col = 'orange', add = T)
1) MASS 패키지 설치와 메모리 로딩
2) R 의 기본함수를 이용하여 brain 컬럼을 대상으로 다음의 제시된 기술통계량 구하기
(1) Animals 데이터 셋 차원 보기
(2) 요약통계량
(3) 평균
(4) 중위수
(5) 표준편차
(6) 분산
(7) 최대값
(8) 최소값
# 2
# 2 - 1)
# install.packages("MASS")
library(MASS)
# 2 - 2)
# (1)
dim(Animals)
# (2)
attach(Animals)
summary(brain)
# (3)
mean(brain)
# (4)
median(brain)
# (5)
sd(brain)
# (6)
var(brain)
# (7)
max(brain)
# (8)
min(brain)
detach(Animals)