☕회고 | 팀 프로젝트 '수성구 카페 상권 분석' 회고1 : 데이터 수집과 정리 시행착오 및 시각화📚

원영·2023년 8월 20일
1
post-thumbnail

🧐 상황

기업과 연계한 프로젝트에서 아래 요구 사항을 받았다.

제공한 키오스크 판매 데이터와 공공 데이터를 활용해 유의미한 상권 분석을 시도하고 이를 시각화 해주세요.

데이터를 분석하고 수집하는 것이 우선 순위라 판단해서, 제공받은 판매 데이터를 분석하고 여러 공공 데이터들을 수집하기로 했다.


☕데이터 수집

제공받은 판매 데이터

  • 2022년 1월부터 8월까지 '매스커피 범물점'과 '매스커피 수성구청점'의 하루 총 매출액 , 시간당 매출액 , 메뉴별 판매개수 정보를 제공받음
  • 날짜별, 시간별 매출
  • 메뉴별 매출

공공 데이터 수집

  • 제공받은 카페들이 모두 대구 수성구에 위치한 카페라서, 이 지역을 중심으로 공공 데이터들을 수집하기로 결정
  • 수성구청과 기상청에서 수성구에 대한 아래 데이터를 수집
    기상청 : 기온 , 전운량 , 풍속 , 강수량
    수성구청 : 동별 개폐업 현황 , 연령·성별별 인구 , 동별 유동인구
  • BE 담당 팀원분들이 크롤링을 통해 수성구의 업종별(식육구이점, 일식, 중식, 한식, 휴게)로 아래 데이터 수집
    가게명 , 도로명 주소 , 지번 주소 , 위도·경도 , 행정동

☕유의미한 데이터 정리

  • 나름대로 공공 데이터 수집은 열심히 했다고 생각했으나...
    이 많은 데이터들을 분석해서 이들과 판매 데이터 간의 유의미한 상관 관계를 뽑아내기는 정말 어려웠음💧

시행착오

  • 판매 데이터와 어떻게든 연관시켜서 규칙이 있는 그래프를 찾아보려고 했으나 실패함
  • 기상청 데이터 - 판매량 비교 (내 담당)
    기온별 판매량 그래프만 어느정도 규칙성이 있음
  • 아래는 팀원분들이 하신 분석
    보이다 싶이 그래프에서 전혀 규칙성을 찾을 수 없었음
  • 연령대 분포별 비교
  • 유동인구 면적 대비 점포수 비교

실패 원인 분석 및 향후 방향성 논의

  • 판매 데이터를 제공받은 지점의 수가 2개로 적음
  • 판매 데이터의 기간이 8개월로 짧음

➡️유의미한 상관 관계를 뽑아내기에는 판매 데이터가 너무 부족함🥲

  • 기업 측에 추가 판매 데이터를 요청드렸으나, 보안 이슈로 어렵다는 답변 받음
  • 이때까지 수집한 데이터들과 그래프 결과를 보여드리며 유의미한 결과를 도출해 상권 분석을 하기는 힘들다고 말씀드림
    대신 수집한 데이터들 중 상권과 관련된 정보들을 정리해서 보여주는 사이트는 어떤지 제안했고, 기업측도 좋은 생각이라고 하셨음

데이터 선별

  • 수집한 공공 데이터 중 상권과 관련 있는 정보를 가공하여 수성구 행정동별로 정리해 최종 데이터 산출
    남녀 비율(남/여) , 평균 연령 , 연간 평균 유동인구(최근 3년 기준) , 업종별 평균 영업기간 , 영업기간 평균 이상 업종(해당 동의 평균 영업기간이 수성구 전체의 평균 영업기간보다 긴 업종)
  • 영업 기간은 매출, 공지시가 등이 종합적으로 영향을 미치는 것으로 간주되어, 핵심 자료로 판단함

☕데이터 시각화

  • 다양한 그래프 사용을 위해 ApexCharts.js 라이브러리 활용
  • 지도에는 업종별 탭으로 구분해 크롤링했던 가게의 위치에 마커를 생성

1. 평균 영업기간

  • 업종별 평균 영업기간은 업종 간 비교가 한눈에 되게 막대그래프로 나타냄
  • 빨간 점선은 해당 업종의 수성구 전체의 평균 영업기간으로, 빨간선보다 높은 값을 가지는 업종이 영업기간 평균 이상 업종에 해당됨

2. 영업기간 평균 이상 업종

  • 영업기간 평균 이상 업종이 무엇인지 바로 알 수 있게 보여줌
  • 라이브러리를 활용하지는 않음

3. 평균연령, 평균 유동인구

  • 수성구의 평균값과 비교가 되게 막대그래프로 표시하고, 해당 동 값은 연두색으로 눈에 띄게 색상을 선정함
  • 4개의 부분이 한 페이지 내에 있게 하기 위해 가로 막대그래프로 표시

4. 남녀 비율

  • 두 값을 비교해서 비율을 나타낸 값이라 파이차트로 표시

데이터 분석을 처음 해봤는데, 생각보다 복잡했다🤯.. 팀원들과 많은 회의를 하며 서로 의지한 덕에 정리할 수 있었다.🙇🏻‍♀️

데이터 수집 및 분석은 팀원들과 다 같이 했었다면, 시각화 부분은 온전히 혼자 담당하게 됐다.😮 선별한 데이터들의 특징에 따라 어떤 그래프로 보여줬을 때 가장 쉽게 이해할 수 있을지 고민해서 그래프의 종류를 결정했고, 의도대로 한 눈에 잘 들어오는 것 같아서 만족스러웠다.🐥

profile
화이팅~~^ㅁ^/

0개의 댓글