회사에서 분석 업무를 안 하는 건 아닌데… 상반기에 파이썬이나 R 등 기존의 분석 툴을 통해서는 거의 진행하지 못했다. 팀 내 선배 분이 토이 프로젝트를 권유해줘서 자체적으로 목표를 세워서 진행했지만 데드 라인이 없다보니깐 흐지부지되는 느낌이었다. 그러던 도중, 서울특별시 광진구에서 주관하는 빅데이터 공모전을 접하게 되어서 스터디 인원과 함께 출품하게 되었다. 캐글처럼 고도의 분석 역량이 필요한 공모전 내용은 아니었기에 용기를 낼 수 있었다. 광진구 지역구민으로 10년 째 거주 중이어서 좀 더 관심이 가기도 했다.
20장 분량의 pdf 제출로 자유 주제이지만 특정 주제에 대해 가산점이 부과되는 내용이 있었다. [교통/주차(10점), 도시기반시설(5점), 치안/방범(5점), 일자리(5점)] 초기에는 소셜 분석을 많이 해 본 경험을 살려서, 지역 구민들의 애로사항, 동향을 수집하고 처리하여 전달하는 서비스를 생각하고 실제로 수집 후 진행해보았는 데 크게 차별화되는 지점을 찾기 어려워 폐기했다.
광진구 지역 공공데이터들을 탐색해본 결과 작년에 광진구에서 주차 및 교통데이터 프로젝트를 추진했고, 공공포털에 이를 다수 확인할 수 있었다. 작년 화장품 회사 근무 시 상권 분석 프로젝트를 진행했던 경험을 살려서 최적의 주차 입지 등을 분석해서 제안할 수 있지 않을까 하는 생각이 들었다. 최근 광진구 동향을 살펴 본 결과, 담장 허물기 주차장을 주요 정책으로 시행하고 있어 데이터 기반으로 담장 허물기 주차장을 제언하기로 결론을 지었다. 또한 다른 스터디 인력 분이 주차 데이터 관련해 과거 부산시 남구에서 진행했던 프로젝트를 공유해주셔서 많은 아이디어를 얻을 수 있었다. 해당 프로젝트에서는 데이터, 실행 코드, 보고서도 모두 공개되어 있었다.
먼저 담장 허물기 주차장을 위해서는 다음과 같은 가설을 생각해보았다.
가설 1. 인구 수, 차량 등록 대수가 많으면 주차장 수가 많이 필요할 것이다.
가설 2. 인근 주차장 수가 부족할 수록 주차장 수요가 많을 것이다.
가설 3. 불법 주정차 단속 이슈가 많이 발생하는 지역일 수록, '담장 허물기 주차장'이 필요할 것이다.
가설 4. 20년 이상의 노후화된 단독 주택일 수록, '담장 허물기 주차장' 정책 제안에 보다 유리할 것이다.
이에 따라 인구 정보, 공영민영주차장 정보, 자동차 등록대수, 주정차단속현황, 주차장 통계, 노후주택 통계 등의 공공데이터를 공공데이터포털, 서울 열린데이터 광장, 국토교통부에서 수집했다. 모두의 주차장 등 API 등을 활용하는 방안도 고려했지만 크게 필요가 없어 배제했다.
[데이터 처리]
[탐색]
[분석]
하기 기준에 따라서 구간화하여 0~100점 부여했고 1~1021까지 순위를 매겼다.
제출 결과는 예선 심사 6인에 들지를 못했다. 6팀 중 5개 팀이 주차 관련 내용으로 발표했었기 떄문에 내 수준으로는 경쟁력이 떨어졌을 것 같다. 실제 보도자료에 따르면 '주차장 필수 구역 지정,단속 경로 최적화' 등을 제시한 조가 대상을 수상했다. 그리고 참여한 팀이 190팀이 넘었다;;
https://www.gwangjin.go.kr/portal/bbs/B0000002/view.do?nttId=6100702&menuNo=200191
지리 공간 데이터 분석이 처음이기 때문에 굉장히 헤맨 지점이 많았다. 좌표 -> 그리드 변환 -> 지도 시각화 하는 작업에서 그리드로 변환이 되지 않거나, 지도에 매핑이 되지 않아서 꽤 골머리를 앓았다. QGIS를 뒤늦게 익혀볼까 고민도 했지만 같이 참여한 동료 덕분에 잘 넘어설 수 있었다.
공모전을 통해 경력을 반드시 추가하겠다는 생각을 가지고 임한 것은 아니었다. 하지만 되짚어보면 경력을 쌓고 기술을 추가하는 것들은 이러한 프로젝트나 업무를 통해서 익히는 것이 많았다는 생각이 들었다. 경력을 추가하지는 못했지만 무의미한 도전은 아니었고 좋은 경험을 쌓을 수 있었다.