코로나 19 확진자 수에 따른 교통량 변화 분석

YHW·2021년 10월 31일
0
post-thumbnail

데.멘.토(데이터 멘토링) 활동 [2021_09_23 ~ ]

GitHub 💻

Contents

1. The purpose of the project

2. Data Description

 Data Sources

 Raw Data

 Data Columns

 Dataframe Shape

3. Code Description

4. Fail Log


The purpose of the project

코로나19 발병 이후 2020~2021년, 2년간 총 4차례의 대 유행이 일어났다. 현재 코로나19 4차 대 유행 이후 거리 두기 단계를 4단계로 올렸음에도 불구하고 확진자 수가 줄어들 기미가 보이지 않고, 주변 지인 중에는 휴가를 떠난다는 사람들 또한 늘어나고 있다. 이러한 이유로 우리 '삼현텍'은 고속도로와 톨게이트 통행량 데이터와 코로나19 확진자 수에 따른 이동량 변화의 상관관계를 matplotlib , seaborn , pandas 를 활용해 분석하려 한다.

코로나19 유행 전인 2018년, 2019년, 코로나 유행의 시작 연도인 2020년, 그리고 올해 2021년까지의 대유행 시기 중 이동량 변화와 확진자 수의 이동량 변화를 분석해 전국적인 차량 이동량과 코로나19 확진자 수의 상관관계를 알아보고, 이를 시각화하는 활동을 통해 코로나19의 위험성을 알리고 경각심을 불러올 수 있는 계기가 되었으면 좋겠다.

DATA Description

Data Sources

코로나 19 확진자 데이터 출처 : 공공데이터포털
교통량 데이터 출처 : 한국 도로공사_고속도로 공공데이터 포털

Raw Data

Data Columns

  • 코로나 19 확진자 데이터
  Covid_case.csv
항목설명항목명(영문)샘플데이터
결과코드resultCode00
결과메시지resultMsgOK
한 페이지 결과 수numOfRows10
페이지 번호pageNo1
전체 결과 수totalCount3
게시글번호(감염현황 고유값)SEQ74
기준일STATE_DT20200315
기준시간STATE_TIME00 : 99
확진자 수DECIDE_CNT8162
격리해제 수CLEAR_CNT834
검사진행 수EXAM_CNT16272
사망자 수DEATH_CNT75
치료중 환자 수CARE_CNT7253
결과 음성 수RESUTL_NEG_CNT243778
누적 검사 수ACC_EXAM_CNT268212
누적 검사 완료 수ACC_EXAM_COMP_CNT251940
누적 확진률ACC_DEF_RATE3.2396602365
등록일시분초CREATE_DT2020-03-15 10:01:22.000
수정일시분초UPDATE_DTnull
  • 교통량 데이터
  2018_01분기.csv ,2018_02분기.csv ,2018_03분기.csv ,2018_04분기.csv ,2019_01분기.csv ,2019_02분기.csv ,2019_03분기.csv ,2019_04분기.csv ,
  2020_01분기.csv , 2020_02분기.csv ,2020_03분기.csv ,2020_04분기.csv ,2021_01분기.csv ,2021_02분기.csv
total : (1789045, 11)
항목명 및 설명샘플데이터
집계일자20180101
영업소코드246
영업소명가락
입출구구분코드0
입출구명입구
TCS하이패스구분코드1
TCS하이패스명TCS
고속도로운영기관구분코드0
고속도로운영기관명한국도로공사
영업형태구분코드0
영업형태명폐쇄식
1종교통량211
2종교통량6
3종교통량6
4종교통량21
5종교통량27
6종교통량4
총교통량275

Dataframe Shape

covid_data_analysis
  • covid_data (998, 17)
  • covid_data_new (998, 5)
  • covid_data_1st_pandemic (60, 5)
  • covid_data_2nd_pandemic (61, 5)
  • covid_data_3rd-pandemic (119, 5)
  • covid_data_4th_pandemic (117, 5)
traffic_data_analysis
  • traffic_data (1789045, 11)
  • traffic_data_total (1276,10)
  • day_traffic_data_1st (7, )
  • day_traffic_data_remain (7, 5)
  • day_traffic_data_total (7, )
  • seoul_traffic_data (1276, 10)
  • daegu_traffic_data (1276, 10)

Code Description

breif description

  • Categorize corona probability_LHJ.ipynb : unit단위로 나눈 코로나 확진자에 따른 교통량 변화 분석
  • Jan,Feb,May_covid_traffic_data_Woo.ipynb : 명절과 연휴기간 코로나 확진자 수와 교통량 데이터에 대한 분석
  • covid_data_analysis.ipynb : 코로나 데이터 정리
  • covid_traffic_7_8.ipynb : 휴가철 코로나 확진자 수와 교통량 데이터에 대한 분석
  • covid_traffic_analysis.ipynb : 총 코로나 데이터와 확진자 수에 대한 분석
  • predict_traffic_cmp_colab.ipynb : 2020년 2021년 교통량 데이터 예측
  • traffic_data_analysis.ipynb : 교통량 데이터 정리
  • SamhyeonTech_Covid19_Traffic_Project.ipynb : 분석 총 정리.

Fail Log

  • 교통량 데이터 예측 : 해당 데이터는 시계열 데이터로 시간에 흐름을 반영하는 LSTM 으로 모델 구성을 진행했으나 모델 이해도가 높지 않아 그리 좋은 결과를 내지 못함
profile
으악!

0개의 댓글

관련 채용 정보