외국인 노동자가 내국인 일자리를 빼앗고 있나
국가통계포털
https://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_2FB017F&conn_path=I2
pandas.to_numeric
tonumeric은 데이터를 숫자 형식으로 바꿔주는 역할을 합니다.
to_numeric의 대표적 인자는 아래와 같습니다.
pd.to_numeric(숫자로 변경할 대상, errors='ignore/raise/coerce')
숫자로 변경할 대상: tonumeric을 적용시켜 숫자형식으로 변경시킬 대상이며 스칼라값, list, tuple, Series 등이 대상으로 지정될 수 있습니다.errors: error는 총 3개의 옵션이 존재합니다.
- errors = 'ignore' -> 만약 숫자로 변경할 수 없는 데이터라면 숫자로 변경하지 않고 원본 데이터를 그대로 반환합니다.
- errors = 'coerce' -> 만약 숫자로 변경할 수 없는 데이터라면 기존 데이터를 지우고 NaN으로 설정하여 반환합니다.
- errors = 'raise' -> 만약 숫자로 변경할 수 없는 데이터라면 에러를 일으키며 코드를 중단합니다.
multiheader(멀티컬럼)
transpose()함수
열과 행을 바꿔줌
미니 프로젝트
주제 : 데이터를 이용한 펙트 체크
체크할 내용 1 : 몽골에서의 한국 위상이 높아 지고 있다고 합니다. 한국의 편의점 문화와 이마트 등이 몽골인들에게 익숙해 지고 있습니다. 그 이유는 외부 활동을 할 수 없는 몽골의 혹독한 겨울에, 한국으로 놀러온 몽골인들이 편의점 알바와 이사짐 센터 알바등을 하며 한국 문화를 체험하고 고국으로 돌아 갔기 때문이라고 합니다.
질문 : 과연 데이터를 사용하여 위 내용을 입증 할 수 있을까요?
필요 데이터 :
- 최근 국내에 출입국한 몽골인의 수
1.1. 그 중 해당 계절에 몽골인이 한국에 입국한 수가 다른 계절보다 많은 지 확인할것!- 위 해당 월에 몽골인이 취업한 수
결과 :
국내 출입국 외국인 수를 확인하고 그 안에 몽골인의 데이터를 확인 할 수 있었음. 하지만 몽골인의 국내 취업한 데이터를 찾기가 어려움
체크할 내용 2 : "외국인 노동자가 내국인 일자리를 빼앗고 있나 [팩트체크K]" 중의 기사 내용 발췌 (https://news.kbs.co.kr/news/pc/view/view.do?ncd=7691013)
질문 : KBS의 뉴스 기사 중에 해당 통계 데이터를 확인하여 검증할 수 있는가?
필요 데이터
- "이민자 체류 실태 및 고용조사" - (통계청, 법무부) 의 실제 csv 혹은 xls 파일
1.1. 통계청에서 해당 보고서를 hwp 파일 형태로 입수하였음
1.2. 실 데이터를 확인하기 위해 KOSIS (국가통계포털) 에서 "고용 | 규모" 로 검색하여 데이터를 확인하였음찾은 데이터
산업별 외국인 취업자 비중 차트
- 산업별취업자이민자10차20231018150816.csv
- 경제활동인구총괄이민자__20231018150755.csv
종사자 규모별 분포 차트
규모연령계층임금계층총액__성별근로자수및근로시간_20231018150948.csv결과 :
뉴스 데이터 중 바 그래프를 그릴 수 있었다.특이사항 :
멀티 해더(컬럼) 부분이 있어서 컬럼 선택 부분을 확인해야 했다.
두번째 해더(컬럼) 부분에 빈 값이 들어 있어서 제거해서 사용하거나, cvs를 읽어 올때 미리 공백을 제거 해서 사용해야 한다.
pivoit 을 사용하여 필요한 데이터를 만들어야 했다.