[R을 이용한 회귀모형] 7가지 어류 종류별 무게 그리고 다른 요인들 (독립변수 x가 2개 이상일때의 중선형회귀모형 적합, avPlots추가변수그림, ANOVA분산분석표로 확인하는 유의미한 요인들)

Hyejin Beck·2024년 4월 21일
0

통계학

목록 보기
9/13

방통대 과제 30점(만점) 맞은 기념으로 올리는 글입니다.

다음은 어시장에서 파는 7가지 종류로 이루어진 어류에 대한 자료 일부이다. Weight을 반응변수y로 하고, 다른 변수를 이용하여 추정하고자 한다. 각 어류 종류별(Species)로 회귀모형식을 적합하고 결과를 설명하시오.

독립변수x가 1개일 때는 단순회귀모형을 적합할 수 있지만, 2개 이상일때는 중선형회귀(중회귀모형) 으로 진행할 수 있다.

데이터 불러오기


각 어류 종류별에는 총 7가지가 있으며, Y는 Weight 무게이고 X1 ~ X5 까지 총 5개의 독립변수(Length1, Lenght2, Length3, Height, Width)가 있다.

독립변수x들 확인하기

우선 어류종류가 Bream일 때의 회귀모형식을 적합해보겠습니다.

회귀모형식 적합

어류종류가 Bream 일 때

회귀방정식 확인

추정된 회귀방정식은 Y = -939.44 + 16.19 Length1 + 17.97 Length2 + - 21.19 Length3 + 64.20 Height + 57.05 * Width 입니다.

지표 확인

이 모형에 대한 결정계수 R2 = 0.9433으로서 중회귀모형이 종속변수 Weight의 총변동을 94.3%정도 설명하고 있음을 나타납니다. 또한 추정값의 표준오차 √MSE = 53.96으로서 잔차의 표준편차(시그마, σ )의 추정값이 53.96입니다.
변수 Length1의 t0 값 = B1 / B1 의 표준오차 = 16.2 / 49.4 = 약 0.32이며, 유의확률 p값 = 0.745임을 보여줍니다. 따라서 유의수준 a = 0.05에서 귀무가설 H0 : B1 = 0 을 기각하지 못합니다. 즉, Length1은 Weight을 설명하는데 그리 큰 영향을 준다고 볼 수 없습니다. 이를 이용해 다른 변수도 확인해보겠습니다.

따라서 p값이 0.05보다 작은 “Height” 변수가 무게”Weight”에 유의미한 영향을 미칠 것으로 보여집니다. Car패키지를 설치 후 avPlots함수를 이용하여 추가변수그림을 보겠습니다.

추가변수그림 그리기

Car패키지 설치
avPlots함수를 이용하여 추가변수그림 그리기

이렇게 그림으로 보아도 Height가 다소 강한 양의 상관관계를 가지고 있습니다.

어류 종류가 Bream이 때의 회귀모형식을 적합해보았는데, 다른 어류종류들도 동일한 방식으로 적합해보겠습니다.

위의 과정 반복

Bream 을 확인했으니 roach , whitefish, parkki, perch, pike, smelt 순으로 진행하겠습니다.

> roach_lm <- lm(Weight ~ Length1 + Length2 + Length3 + Height + Width, data = roach)
> summary(roach_lm)

Species종류별로 P값을 정리해봄으로서 유의수준 0.05이하의 유의미한 값은 푸른색으로 색칠하여 구분해보았습니다. Pike종에서 다소 유의미한 값이 4개로서 많이 나왔습니다.
일단 Species가 Bream인 값에 한하여 분산분석표를 구해보겠습니다.

ANOVA 분산분석표

회귀제곱합은 각각의 독립변수의 Sum 값을 더한 값으로서, 각 독립변수가 종속 변수를 설명하는데 기여한 정도를 나타냅니다. Bream의 회귀제곱합은 1306627 + 41948 + 4270 + 45459 + 5337 = 1403641 입니다.
이전 summary(bream_lm)했을 때 F값은 96.42, P값은 2.2e-16이었습니다.
이와 같은 방식으로 Species 종별 지표들을 확인해보겠습니다.

따라서 수치가 적거나 데이터값의 오류 등으로 NaN이 나온 WhiteFish 종을 제외하곤 나머지 어류종에 대해선 적합된 회귀모형식이 모두 유의미한 결과가 나왔습니다.

profile
데이터기반 스토리텔링을 통해 인사이트를 얻습니다.

0개의 댓글

관련 채용 정보