지난 포스팅에서 성별에 따른 월급 차이가 어느 정도인 지 분석해보았다. 이번에는 최종학력에 따라 월급에 차이가 있는지, 있다면 어느정도 차이가 나는 지에 대해 분석해보고 자 한다.
최종 학력에 따른 월급 차이
https://www.koweps.re.kr:442/main.do
Koweps_hpc16_2021_beta1.sav
16차 머지데이터_변수명_20220404.xlsx 참고
구분 | 코드 | 변수명 |
---|---|---|
최종 학력 | p1607_3aq1 | education |
일한달의 월 평균 임금 | p1602_8aq1 | imcome |
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
origin_data = pd.read_spss('data/Koweps_hpc16_2021_beta1.sav')
data = origin_data.copy()
data = data.rename(columns={
'p1607_3aq1': 'education',
'p1602_8aq1': 'income',
})
조사 설계서에 따르면 최종학력 변수는 다음과 같다.
구분 | 값 |
---|---|
중학교 졸업 이하 | 1 |
고등학교 중퇴, 졸업 | 2 |
전문대학 재학, 중퇴, 졸업 | 3 |
대학교 (4년제) 재학, 중퇴, 줄업 | 4 |
대학원 이상 | 5 |
모름 / 무응답 | 9 |
data['education'].value_counts()
education | |
---|---|
4.0 | 101 |
3.0 | 52 |
2.0 | 42 |
1.0 | 7 |
5.0 | 4 |
💡 education에 9가 없는 것으로 보아 이상치는 없는 것으로 확인된다.
data['education'].isna().sum()
12938
💡 총 12,938개의 결측치 (NaN) 가 있다.
data = data.dropna(subset=['education'])
data['education'] = np.where(data['education'] == 1 , '중학교 이하',
np.where(data['education']== 2, '고등학교',
np.where(data['education']==3 , '전문대',
np.where(data['education']== 4, '대학교', '대학원 이상')
)))
data['education'].value_counts()
education | |
---|---|
대학교 | 101 |
전문대 | 52 |
고등학교 | 42 |
중학교 이하 | 7 |
대학원 이상 | 4 |
data['income'].describe()
Income | |
---|---|
count | 60.000000 |
mean | 263.383333 |
std | 179.086769 |
min | 24.000000 |
25% | 126.500000 |
50% | 249.000000 |
75% | 342.000000 |
max | 1000.000000 |
💡 월급은 평균 263만 원이며, 최소 24만 원에서 최대 1,000만 원에 분포되어 있다.
월급은 126만 원 ~ 342만 원에 가장 많이 분포되어 있다.
edu_income = data.dropna(subset=['income'])\
.groupby('education', as_index=False)\
.agg(mean_income = ('income','mean'))\
.sort_values('mean_income', ascending=False)
edu_income
education | mean_come | |
---|---|---|
1 | 대학교 | 310.800000 |
2 | 대학원 이상 | 282.666667 |
0 | 고등학교 | 243.000000 |
3 | 전문대 | 192.000000 |
4 | 중학교 이하 | 27.000000 |
💡 2021년 자료 분석 결과 대학교 졸업자의 평균 월급이 310만 원으로 가장 높고, 중학교 이하자의 평균 월급이 27만 원으로 가장 낮았다. 최종학력에 따라 월급에 차이가 있음을 알 수 있다.
plt.rcParams.update({'font.family': 'AppleGothic'})
sns.barplot(data=edu_income, x='education', y='mean_income')
그래프로 확인해도 최종 학력에 따라 월급 차이가 나는 것을 확인할 수 있다.