[결론] 결론 도출

JJangnaa·2023년 5월 9일
0

 서로 다른 2 가지 방법으로 정보를 얻었지만 같은 결과물을 도출할 수 있었다. 그리고 이 결과로 코로나에 확산이 되어도 사망자의 수가 양의 상관관계를 이룬다고 할 수 없다. 연간 총 확진자와 총 사망자를 나타내는 20 개 국을 보았을 때 총 확진자수는 미국, 유럽 등이 상위권을 차지하지만 총사망자의 결과는 러시아, 브라질이 2,3 위를 따르고 있다.

 이 결과에 특이점은 미국인데 총 확진자수가 많으면서 총 사망자수가 가장 많다. 미국은 우리나라 보다 잘 발달된 나라라고 알고 있지만 인구도 많고 땅이 넓어 이와 같은 바이러스를 이겨내기 위한 의료시스템이 아직 충분하지 않은 것으로 보인다.

 그리고 인구의 순위 1 위인 중국이 순위에 없어 가지고 있는 정보의 정확성을 의심해볼 여지가 있다. 평소에도 마스크를 쓰는 대한민국에서는 총 확진자가 4 위였음에도 불구하고 총 사망자 리스트에서는 순위권 밖에 위치한다. 다른 나라에 비해 확진자를 수용할 수 있는 의료시스템이 구축되어 있지만 전염을 막기위한 시민들의 참여가 큰 역할을 했을 것이다


~~ TMI !!! ~~
 본 프로젝트는 R을 배운지 일주일도 채 안되서 시작했다. 데이터 다루는 거 진짜 하나도 모를 때 시작한거라 오래걸리도 했고 진행 과정에 오류도 정말 많다.. ^^ 끝내는 것에 급급해 이상치 및 결측치 확인을 제대로 못했다.
 근데 이런 사실을 어떻게 알게 되었느냐... 그것은 바로.. R을 배운 후 python을 배울 때 본 프로젝트와 동일한 주제로 재진행 했었기 때문이다. 그래서 CSSE Covid19 데이터 및 전처리 과정은 이미 익숙해졌기에 세밀한 부분을 체크할 수 있었다.
 그리고 여기서 사용한 csv 파일은.. 일별로 정리 되어 있는 것을 활용해서 파일 불러오는 것에 골치 아팠었는데, 모든 일자의 정보가 정리 되어 있는 한 개의 파일이 있다는 사실을 공유 받아 좀 더 손쉽게 분석 과정을 진행했었다.
 python으로 진행한 코로나 데이터 분석은 R 프로젝트 복기를 완료한 후 시작할 예정이니 참고하기 바란다.
profile
귀여운게 좋아

0개의 댓글