[서론] 소개

JJangnaa·2023년 5월 9일
0

1. 목적

 : 분석용 데이터 구축

2. 진행 기간

 : 2023.03.06 ~ 2023.03.14 (평일 기준 7일)

3. 데이터 셋

 : COVID-19 from CSSE

4. 데이터 대상 기간

 : 2021.08. ~ 2022.07 (1년, 365일)

5. 분석 과정

내용
1국가별(지역별X) 코로나 발생자 수와 사망자 수의 일별 데이터를 기준으로 전처리
→ 국가, 총발생자수, 총사망자수, 일평균 발생자수, 일평균 사망자수 리스트 제시
※ 누적데이터인 경우 누적데이터와 일별 데이터의 총합과 일평균값과 결과 비교
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2데이터가 0인 경우(코로나 환자 0)와 데이터가 없는 경우를 구분하여 전처리
※ 전처리 시 data가 없는 국가는 제외하고 제외된 국가 리스트 제시
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
31년동안 코로나 총 발생자수, 총 사망자수, 일평균 발생자수, 일평균 사망자 수 기준으로
가장 많은 20개 국가를 내림차순으로 정렬
※ 4가지 기준 각각 sorting
profile
귀여운게 좋아

0개의 댓글