프로젝트(데이터 분석) - 서울시 상권분석을 통한 최적의 치킨집 위치 선정

HJ·2023년 12월 4일
0

계기

올해 2월부터 8월까지 오프라인 부트캠프에 참여했다. 부트캠프에서 한달차까지 python 및 간단한 데이터 분석 스킬들을 학습하고 , 응용을 위해 간단한 프로젝트를 진행했다. 그때 진행했던 프로젝트이다. 기간은 3일 , 인원은 4명에서 진행했다. 짧은 시간에 진행한 미니 프로젝트이지만 평소 내가 관심있었던 상권분석을 아이디어로내 주제로 다뤘고 , 원하는 결과를 도출했기에 나름 의미있는 프로젝트라고 판단하여 작성해보려고 한다. 블로그 다른글 프로젝트보다 깊이는 확실히 떨어지지만 나의 성장 과정속에는 이 프로젝트 경험도 중요한 경험이었다. python을 주로 활용해 분석했고 , 협업은 slack,google drive를 활용했다.

프로젝트 배경 및 목표

배경

배경을 한번에 정리하자면 위 사진과 같다. 코로나19사태가 장기적으로 지속됨에 따라 자영업자들의 폐업은 늘어났다. 실제 지표를 보면 자영업자 70%는 5년안에 사업을 정리할정도로 이 문제가 심각함을 느낄수있다. 위 사진은 가상으로 설정한 고객 페인포인트이다. 이런 상황속에 '이민수씨(가상 인물)"가 만약 개업을 하려고 한다면 쉽게 도전할 수 있을까? 아마 많은 불확실성을 감당하고 도전하게 될것이다. 따라서 우리팀은 위와같이 새로 개업을 준비하는 자영업자들을 돕기 위해 유리한 위치를 추천해주기 위한 프로젝트를 진행하게 되었다.

목표

상권 분석을 통해 개업시 입지 선정에 어려움을 겪고 있는 자영업자를 돕기 위해 개업시 유리한 입지를 추천

활용 데이터셋

데이터셋은 공공데이터셋을 주로 활용했다.
상권분석에 필요한 카테고리를 총 6가지로 나누고 각 카테고리마다 2~3개의 데이터셋을 사용했다. 카테고리 및 활용 데이터는 다음과 같다.

상권 및 경쟁업체 분석
-서울시 상권 데이터

폐업률 분석
-서울시 일반음식점 인허가 정보 데이터

생활인구 현황 분석
-행정동 단위 서울 데이터
-생활인구 데이터

주변 시설 분석
-전국유치원,초중고,주소/전국대학주소 데이터
-전국도시공원정보표준데이터

교통 인프라 분석
-전국 버스 정류장 위치정보데이터
-도시철도역사정보 데이터

상권별 매출 , 임대료 분석
-영세자영업규모별면적(평당)매출액 데이터
-영세자영업
규모별면적(평당)임대료 데이터
-서울형 통상임대료 조사 및 분석 용역-서울시 데이터

EDA및 전처리

각 데이터별로 필요 상황에따라 EDA및 전처리를 진행했기 때문에 이부분은 뒤에 분석 내용에 각자 다르게 다 포함되어있다.

분석

1) 구 단위 지역 선정 & 업종 선정

먼저 , 지역단위 및 업종의 범위를 좁혀 집중하기로 했다.

상권 대분류 분석

위 파이차트는 서울시 상권 데이터 대분류 업종의 분포를 나타낸것이다. 다른 업종에 비해 '음식'이 월등하게 많은것을 확인 할 수 있다. 이를 통해 대분류중 '음식'에 대한 상권을 추천하는 방향으로 결정하였다.

업종별 평균 매출 분석

위 상가 규모별 음식점 매출 데이터에 상가수곱해 영세자 [영업 + 규모별 + 면적(평당) + 매출액] 을 구했다. 오른쪽 시각화 결과를 보면 제과점,패스트푸드점,치킨전문점순으로 높은것을 확인할 수 있다.

위 자료는 모두 많이 봤을 자료일것이다. 위 자료와 같이 "어느길로 가든 결국 치킨집이다" 라는 말처럼 치킨집은 자영업 하면 가장많이 떠오르는 단어일것이다. 따라서 우리팀은 위에서 진행한 분석결과와 위 자료를 참고해 , 가장 많은 음식점이면서 면적당 매출액도 3등으로 상위권에 있는 치킨집 개업으로 범위를 좁혔다.

구별 임대로 대비 매출 분석

이제 치킨집으로 범위를 좁혔으니 최적의 입지를 찾아야한다. 따라서 다양한 입지 선정 기준중 첫번째로 가성비 좋은 입지를 찾기위해 임대료,매출분석을 진행했다.

첫번째로 행정구별로 데이터를 통합하여 평균 임대료 및 매출을 산출해냈고 , 행정구별로 산출된 매출액/임대료 를 계산해 임대료대비 매출이 좋은(즉,가성비 좋은) 구단위를 선정했다. 결론적으로 관악구,구르고,성동구 순으로 가성비가 좋은점을 알 수 있다.

구별 치킨업체 수 분석

이번에는 구단위별로 치킨집 과밀집지역을 찾기위해 업체수를 비교해보았다.

강남,강서,송파구가 치킨집이 밀집되어있는것을 확인해볼수 있다. 치킨집이 많다면 경쟁업체가 많다는거다. 따라서 추후 최종 입지선정 평가를 계산할때 치킨집이 많을수록 (-)가 된다.

구별 치킨집 면적대비 폐업 수 분석

치킨집 폐업이 많은 지역도 피해야 할것이다 . 따라서 구별 면적대비 치킨집 폐업수 분석을 해보았다. 구별 면적을 따로 조사하고 , 치킨집중 폐업상태인 업체들만 골라 구별 면적대비 얼마나 폐업했는지 확인해보았다.

면적 대비 동대문구 , 양천구등이 면적대비 많이 폐업한것을 확인할 수 있다. 이 지표 역시도 최종 입지선정 평가 계산에 높을수록 (-)로 적용된다.

행정구 최종 선정

지표1: 시군구 면적별 폐업률
지표2: 경쟁 치킨집 수
지표3: 임대료 대비 매출액

앞서 구한 결과를 토대로 위와 같은 총 3가지 지표를 통해 행정구별로 순위를 구하고 등수 합계를 통해 점수를 계산하였다.

최종적으로 순위점수가 가장 낮을수록 유리하게 되는데 , 성동구가장 낮은 점수로 좋은 행정구로 선정되었다.

2) 동별 수요자 분석(동 단위 입지 선정)

행정동 단위 서울 생활인구 분석

먼저 , 행정동별로 주간,야간으로 나눠 평균 생활인구수를 분석했다.

주간 생활인구는 성수2가3동이 , 야간 생활인구는 왕십리,옥수동등이 많은것을 확인 할 수 있다.

경쟁 치킨 업체수 분석(동단위)

구를 선정했을때 사용한 치킨집 업체 수 데이터를 활용해 동단위로 재 집계 하여 동단위 경쟁업체(치킨집) 수를 분석했다.

위 결과와 같이 왕십리 도선동,행당1동등이 경쟁업체(치킨집) 수가 많은것을 확인할 수 있다.

주변 시설 분포(공원시설,학교시설,교통시설)

성동구 행정동별 주변 시설 분포(공원시설,학교시설,교통시설)을 확인해보았다.
공원 시설은 공원 시설 데이터로 , 학교 시설은 각종 초,중,고 학교시설 + 대학교 시설 데이터로 , 교통시설은 버스데이터+도시철도데이터로 성동구만 필터링해 분석했다.

<공원 시설 분포>

<학교 시설 분포>

<교통 시설 분포>

결과

지표1: (주간/야간 생활인구 수)
지표 2: (경쟁 치킨 업체 수)
지표 3: (주변 공원 수)
지표 4: (주변 학교 수)
지표 5: (주변 버스 정류장 수)
지표 6: (주변 지하철 역 수)

앞서 구한 지표 결과들을 토대로 위에서 행정구를 선정하는 방식과 동일하게 행정동을 선정했다.

결론으로 1위: 성수 1가 1동, 2위: 행당2동, 3위: 성수 2가 1동가 최적의 입지로 선정되었다. 이를 토대로 서울시에 치킨집을 차리려는 자영업자들에게 도움이 되는 지표를 산출해냈다.

내역할

이 프로젝트는 모두의 역할이 비슷했다. 서비스단까지 구현하는 프로젝트가 아니었기에 개발 파트별로 업무를 분배하지는 않았고 , 전과정(데이터 전처리 및 분석 ->시각화->결과도출)을 데이터별로 나눠서 업무를 분배했다. 나는 메인 데이터인 서울시 상권 데이터를 다루는 역할을 했으며 내가 제시했던 아이디어였기에 전체적인 분석 프로세스를 방향 설계를 맡아서 수행했다.

느낀점

다른 프로젝트와 마찬가지로 아쉬운점이 남는 프로젝트이다.역시 한정된 시간안에 완성해야 했기에 지역범위/업종 범위를 많이 좁혔고, 시간이 충분한 환경에서 진행하고 데이터만 확보된다면 지역별로,업종별로 최적의 입지를 선정할 수 있다고 생각한다.

또한 , 최적의 입지를 선정하는 방식에서도 해당 프로젝트에서 사용한 지표외에 다양한 지표를 추가할 수 있을것이며 , 지표를 통한 최종 입지 산출 방식에서도 단순한 순위 방법이 아닌 가중치를 부여해 계산하는방법을 사용해 더 정교하게 가능할것이다.
이를 토대로 지역별,업종별 추천 시스템까지 구현이 가능할수 있을것이라 생각이 든다.

하지만 , python교육과정중에 오로지 python활용해 데이터를 전처리,시각화,결과도출까지 모두 했다는점에 의의를 두고 , 평소 하고싶었던 상권분석을 직접 해봄으로써 데이터분석에 향한 관심도는 더 상승하게 되는 좋은 경험이었다.

profile
데이터 공부 기록

0개의 댓글

관련 채용 정보