기술통계분석 예제

hottogi·2022년 11월 4일
0

1. descriptive.csv 데이터 셋을 대상으로 다음 조건에 맞게 빈도분석 및 기술통계량 분석을 수행하시오.

1) 명목척도 변수인 학교유형(type), 합격여부(pass)변수에 대해 빈도분석을 수행하고 결과를
막대 그래프와 파이 차트로 시각화
2) 비율척도 변수인 나이 변수에 대해 요약치(평균, 표준편차)와 비대칭도(왜도와 첨도)
통계량을 구하고, 히스토그램을 작성하여 비대칭도 통계량 설명
3) 나이 변수에 대한 밀도분포 곡선과 정규분포 곡선으로 정규분포 검정

# 1
setwd("C:/Rwork/")
data <- read.csv("dataset2/descriptive.csv", header = TRUE)
head(data)
data

# 1 - 1)
data$type2[data$type == 1] <- "a"
data$type2[data$type == 2] <- "b"
x <- table(data$type2)
y <- prop.table(x)
round(y * 100, 2)
barplot(y)
pie(y)

data$pass2[data$pass == 1] <- "합격"
data$pass2[data$pass == 2] <- "실패"
x1 <- table(data$pass2)
y1 <- prop.table(x1)
round(y1 * 100, 2)
barplot(y1)
pie(y)

# 1 - 2)
plot(data$age)
data <- subset(data, data$age >= 0 & data$age <= 110)
x <- data$age
mean(x)
sd(x)

library(moments)
age <- data$age
skewness(age)
kurtosis(age)
hist(age)

# 1 - 3)
hist(age, probability = T, main = "hello")
lines(density(age), col = 'Maroon 1')
x <- seq(1, 30, 1)
curve(dnorm(x, mean(age), sd(age)), col = 'orange', add = T)

2. MASS 패키지에 있는 Animals 데이터 셋을 이용하여 각 단계에 맞게 기술통계량을 구하시오.

1) MASS 패키지 설치와 메모리 로딩
2) R 의 기본함수를 이용하여 brain 컬럼을 대상으로 다음의 제시된 기술통계량 구하기
(1) Animals 데이터 셋 차원 보기
(2) 요약통계량
(3) 평균
(4) 중위수
(5) 표준편차
(6) 분산
(7) 최대값
(8) 최소값

# 2
# 2 - 1)
# install.packages("MASS")
library(MASS)

# 2 - 2)
# (1)
dim(Animals)

# (2)
attach(Animals)
summary(brain)

# (3)
mean(brain)

# (4)
median(brain)

# (5)
sd(brain)

# (6)
var(brain)

# (7)
max(brain)

# (8)
min(brain)
detach(Animals)
profile

0개의 댓글

관련 채용 정보