교차분석과 카이제곱검정 예제

hottogi·2022년 11월 4일
0

1. 직업 유형에 따른 응답 정도에 차이가 있는가를 단계별로 검정하시오 (동질성 검정)

1) 파일 가져오기
Response.csv
2) 코딩변경 - 리코딩
Job 컬럼: 1. 학생, 2. 직장인, 3. 주부
response 컬럼: 1. 무응답, 2. 낮음. 3. 높음
3) 교차 분할표 작성
4) 동질성 검정
5) 검정결과 해석

# 1.
# 1)
data <- read.csv("dataset2/Response.csv")
head(data)

# 2)
data <- subset(data, !is.na(response), c(job, response))
data$job2[data$job == 1] <- "학생"
data$job2[data$job == 2] <- "직장인"
data$job2[data$job == 3] <- "주부"

data$response2[data$response == 1] <- "무응답"
data$response2[data$response == 2] <- "낮음"
data$response2[data$response == 3] <- "높음"

# 3)
table(data$job2, data$response2)

# 4)
chisq.test(data$job2, data$response2)

# 5)
# p-value < 0.05 이므로 귀무가설 기각
# 직업 유형에 따라 응답정도에 차이가 있음.

2. 나이(age)와 직위(position)간의 관련성을 단계별로 분석하시오 (독립성 검정)

1) 파일 가져오기
cleanData.csv
2) 코딩 변경(변수 리코딩)
X <- data$position #행: 직위 변수 이용
Y <- data$age3 #열: 나이 리코딩 변수 이용
3) 산점도를 이용한 변수간의 관련성 보기
(힌트. Plot(x,y)함수 이용)
4) 독립성 검정
5) 검정 결과 해석

# 2.
# 1)
data2 <- read.csv("dataset2/cleanData.csv")
head(data2)

# 2)
X <- data2$position #행: 직위 변수 이용
Y <- data2$age3 #열: 나이 리코딩 변수 이용

# 3)
plot(X,Y)

# 4)
CrossTable(X, Y, chisq = TRUE)

# 5)
# p-value가 0.05보다 작으므로 유의함.
# 대립가설 채택

3. 교육수준(education)과 흡연율(smoking)간의 관련성을 분석하기 위한 연구가설을 수립하고, 단계별로 가설을 검정하시오. (독립성 검정)

귀무가설(H0):
연구가설(H1):
1) 파일 가져오기
smoke.csv
2) 코딩변경
education 컬럼(독립변수) : 1. 대졸, 2. 고졸, 3. 중졸
smoke 컬럼(종속변수): 1. 과다흡연, 2. 보통흡연, 3. 비흡연
3) 교차분할표 작성
4) 검정 결과 해석

# 3.
# 귀무가설(H0): 교육수준과 흡연율간에 관계가 없다.
# 연구가설(H1): 교육수준과 흡연율간에 관계가 있다.

# 1)
setwd("C://Rwork")
data3 <- read.csv("dataset2/smoke.csv")
head(data3)

# 2)
data3 <- subset(data3, !is.na(smoking), c(education, smoking))
data3$education2[data3$education == 1] <- "대졸"
data3$education2[data3$education == 2] <- "고졸"
data3$education2[data3$education == 3] <- "중졸"

data3$smoking2[data3$smoking == 1] <- "과다흡연"
data3$smoking2[data3$smoking == 2] <- "보통흡연"
data3$smoking2[data3$smoking == 3] <- "비흡연"

# 3)
x <- data3$education2
y <- data3$smoking2
CrossTable(x, y, chisq = TRUE)

# 4)
# p-value < 0.05 이므로 귀무가설 기각
# 교육수준과 흡연율간에 관계가 있다.
profile

0개의 댓글

관련 채용 정보