궁금해서 시각화 해보는 서울시 자치구별 맛집

조유솔·2024년 8월 26일
0
post-thumbnail

최근 데이터 시각화 도구인 Matplotlib과 Seaborn을 복습했다.

코드와 이론을 공부하는 것에서 그치기엔 조금 아쉬워 실제 데이터를 이용해 인사이트를 도출해보았다.

그래서 공공데이터 포털을 뒤져보다 <지역별 음식점 소비기반 트렌드>를 발견!

https://data.go.kr/data/845270/linkedData.do

상권 분석이라니 재밌겠다! 싶어 바로 코랩을 키고 Visualization을 했다🙂

서울특별시의 자치구별 맛집 수와 인구수 등의 정보가 포함된 이 데이터셋을 사용하여,

몇가지 간단한 질문에 대한 데이터 기반의 답변을 도출해보았다.


1. 어디에 맛집이 많을까?

결측치랑 이상치를 제거하고서 서울특별시 자치구별 맛집 수를 바 플롯(bar plot)으로 시각화했다.

송파구>강남구>강서구순으로 맛집 수가 많았다.

다만 먹거리로 유명한 종로구와 중구가 중하위권인 것에 대해 의문이 들었다.


2. 사람수 대비 맛집 비율이 높은 지역은?

종로구와 중구의 맛집수가 중하위인 건 절대 수치의 오류에 기인할 수 있다.

만약 종로구와 중구가 상대적으로 작은 인구수를 가진다면??

맛집의 절대적인 숫자는 적게 나타날 수 있지만, 그게 그 지역이 맛집으로 발달하지 않았다는 의미하진 않는다.

절대적인 맛집 수만을 보고 특정 자치구가 더 '맛집이 많다'고 판단하기보단, 인구 대비 맛집 수라는 비율로 접근하는 게 더 타당하지 않을까? 라는 생각에 인구수와 맛집수 사이의 관계를 확인해보았다.


자치구별로 인구수를 시각화해보니, 송파구>강남구>강서구>..>종로구>중구 순으로 인구가 많았고

이 결과는 위의 맛집수 그래프와 어느정도 일치한다.

🧐 고민했던 것
: 바플롯에서 범주가 너무 많으면 가독성이 떨어진다!
horizontal bar plot으로 나타내보자(y축에 범주를, x축에 값을 배치하자)

Vertical bar plot보다는 비교하기 수월하지만, 여전히 가독성이 낮다.
→ 인구수와 맛집수 사이의 관계성이 더 직관적으로 시각화 하기 위해 산점도를 사용하였다.

Pearson 상관계수를 통해 구한 인구수와 맛집 수 간의 선형 상관성 역시 0.4574 정도.

강한 상관관계는 아니지만, 인구수와 맛집수의 선형적 상관성이 다소 높다고 해석 가능하다!

🧐 고민했던 것
: 그러면 송파구, 강남구 등은 맛집이 특히 발달해서 그 수가 많다기보다 그냥 인구수가 높으니 음식점 자체가 많아져 맛집 수가 높은 것 아닐까? 데이터를 통해 확인해보자

이 점을 감안해 인구수 대비 맛집 비율을 나타내는 FOOD_POP_RATIO 변수를 추가하여 분석을 진행했다.

( 각 자치구의 맛집 수 / 각 자치구의 인구수 ) x 100

분석 결과 중구와 종로구에서 FOOD_POP_RATIO 값이 높게 산출되었다.

중구와 종로구는 맛집수 자체로는 하위권이었으나 해당 그래프에서 1, 2위를 차지하며 인구대비 맛집의 비율이 높았다!

(을지로 등 직장인 회식장소에 맛집 다수 분포)


분석 3. 각 자치구는 어떤 음식으로 유명할까?

각 자치구의 대표적인 맛집 유형을 분석하기 위해 파이 차트를 사용하였다.

종로구와 중구에서 대부분의 맛집 유형이 높은 비율을 차지하고 있다.

여기서 주목할 점은 기타 외국식의 경우 용산구가 1위를 차지하고 있다는 것인데,

외국인이 다수 거주하는 이태원 거리의 영향으로 생각된다.

0개의 댓글