23.12.22. D5

예진·2023년 12월 22일
0

TIL

목록 보기
5/68
post-thumbnail

https://www.notion.so/2023-A01-e5f3cdf68357425ab5f48138ba6c4234
오늘 TIL은 미니프로젝트 대본으로 대체.
그동안 너ㅓㅓㅓㅓ무 고생했다!


‘저희는 날씨가 안좋으면 교통 사고가 많이 일어날까’ 라는 의문에서 출발했습니다.
일상적으로 아침에 일어나면 날씨를 확인하고 오늘의 교통수단을 정합니다. 기상 상태와 교통상황은 얼마나 관련이 있을지, 눈과 비가 많이 오면 실제로 사건 사고도 많이 일어날지. 이러한 이야기를 바탕으로 기상 상태와 교통 사고 발생의 연관성 분석을 해보았습니다. //

‘날씨가 안좋을 수록 교통 사고 발생 빈도가 높다’는 가설을 세우고,
교통사고 발생에 영향을 미치는 날씨 요소를 판별하고 기상 악화에 따른 이동수단 변화 추이를 분석하고자 했습니다.

공공데이터 포털과 통계청, 교통안전정보관리시스템(TMACS), 기상청 자료개방포털에서 데이터를 확보하였고, 주로 csv, 엑셀 데이터 였습니다. //

그 중 2020년부터 21년까지 서울 지역 자치구별 기상상태에 따른 사고발생 수와 사망자, 부상자 수를 바탕으로 기초 통계량 분석을 진행했습니다. 시간관계상 매니저님의 도움을 받아 시각화 해보니 이러한 그래프를 얻을 수 있었고, 과거 지역별 교통사고의 현황을 나타낼 뿐 저희의 가설을 증명할만한 정보를 찾을 수 없었습니다. //

같은 데이터를 다시 한 번 뜯어보니 저희의 분석 목적도, 데이터의 기준과 범위도 모호하다는 점을 알 수 있었습니다. 1년 중 대다수는 맑거나 흐린 날이라 교통사고 발생건수 또한 월등히 높아 기초통계분석에서는 기상상태와 교통사고의 연관성을 찾을 수 없었습니다. 맑거나 흐린 날의 교통량 또한 눈이나 비가 오는 날에 비해 월등히 높고, 한 해 중 눈이나 비가 오는 날보다 맑거나 흐린 날 일수의 비중이 훨씬 크기 때문일 것으로 예상됩니다. //

보다 정확한 비교분석을 위해,
강수량 적설량이 있는 경우와 없는 경우, 데이터 셋을 둘로 구분하고
일 강수량 10mm 미만은 흐린날에 포함하는 등
조건을 구체적으로 설정해 다시 데이터를 뜯어보았습니다.

기준을 새로 만들어 통계를 낸 결과, 이러한 수치 상의 차이를 확인할 수 있었습니다. 눈과 비가 온 날은 흐린 날에 비해 평균 교통사고 수도 높고, 평균 부상자 수도 높습니다. 뚜렷한 차이는 아니었으나, 눈과 비가 내리는 날과 흐린 날의 일수 차이가 압도적으로 크다는 점과 맑은 날, 즉 기상 상태가 좋은 날을 제외한 데이터만을 이용했다는 점에서 그나마 유의미한 차이라고 볼 수 있었습니다.

결론은 저희가 시도한 분석은 ‘날씨가 안좋을 수록 교통사고 발생 빈도가 높다’는 저희의 가설을 뒷받침 해주지 못한다! 입니다. 교통사고 발생에 가장 영향을 미치는 날씨 요소 판별도 기상 악화에 따른 이동수단변화 추이 분석도 저희가 선택한 데이터와 분석 방법으로는 알 수 없었습니다.

왜 이런 결론이 나오게 됐는지 원인을 생각해봤을 때,

-분석 목적이 추상적 이고
-데이터 수집에 앞서 세워야 할 기준이 많은데 그러지 못했으며
-수집을 많이 했어도 기준이 모호한 데이터가 많아 분석에 용이하지 않았습니다.

-기상 데이터를 예로 들면 맑음에 해당하는 날씨의 기온, 습도 온도까지 데이터로서 봐야하는지도 의문이었고, 교통사고에 영향을 주는 날씨려면 강수량이 얼마여야 하는지 적설량이 어느 정돈지 등의 기준점이 역시나 문제였습니다.
-대중교통 이용량 또한 데이터를 구하긴 했지만 일별 시간대별까지 지나치게 세분화된 자료들이 많아 “날씨가 안좋을 때는 대중교통을 많이 이용하는 구나” 를 알 방법이 없었습니다.
-또 저희가 서치한 대부분의 교통 데이터는 로우데이터가 아니라 이미 분석이 끝나있는 자료들이라 사용하기 어려웠던 문제가 있었습니다.

-가장 큰 문제는 저희는 기술도 통찰력도 부족한 “생 뉴비였다”, 수요일 밤부터 시작해 시간이 이틀밖에 없었다. 는 점이었는데요. 중간에 팀프로젝트를 포기할까 싶기도 했지만 의미없다는 것을 찾아낸 것 또한 의미가 될 수 있다고 생각해 프로젝트를 끝까지 결론 짓는 것 자체에 의의를 두기로 했습니다.
사람이 둘 뿐이라 매니저님과 튜터님을 붙잡고 괴롭혀도 데이터 분석을 하는데에는 한계가 있더라구요. 오히려 이번 미니프로젝트를 계기로 더 많은 것을 배우고 내 것으로 만들어 어떤 데이터가 주어져도 방법을 찾아내는 분석가가 되어야겠다는 오기가 생겼습니다.

일주일간 프로젝트 하랴 공부하랴 모두 고생 많으셨고 도와주신 튜터님 매니저님께도 감사인사 드리며 발표 마치겠습니다!

profile
Data Analysis / 맨 땅에 헤딩

1개의 댓글

comment-user-thumbnail
2023년 12월 26일

안녕하세요, 오늘 알게된 A08조 팀원 황인성입니다. 노션에 적어주신 링크를 보고 방문했어요. 지난주에 매우 고생 많으셨습니다. 지난주에 예진님 발표를 들을 때 제가 좋아하는 '교통' 관련 주제라서 끝까지 집중해서 들었던 기억이 나네요. 저도 언젠가 공공데이터포털에서 교통카드 자료를 받아서 통행패턴을 분석해보고 싶네요. 고생 많으셨습니다!

답글 달기