1) 서울시 스타벅스 매장 위치 크롤링
2) 서울시 이디야 매장 위치 크롤링
3) 두 매장의 위치 분석
① 구 별 각 매장 수 합계를 비교하여 시각화
② 도로명 주소를 이용하여 위도, 경도를 반환받고 같은 구 내에 있는 두 매장의 위치 차이 분석
- 스타벅스 매장에서 2km 보다 더멀리 떨어진 이디야 매장은 분석에서 제외
- 각 구의 스타벅스로부터 직선거리 기준 가장 가까운 이디야 매장을 찾고, 100m/300m/500m/700m 이내에 포함되는 개수 비율을 구하여 비교
- 두 브랜드 지점별 거리가 2km 이내 매장을 기준으로 100m/300m/500m/700m 이내에 있는 이디야 매장 비율을 구하고 관계 분석
③ 구 별 매장을 지도로 시각화하여 분석
② beautifulsoup을 이용해 601건 주소 크롤링
③ 크롤링한 데이터를 이용가능한 주소 형태로 가공
이디야 공식 홈페이지
- https://www.ediya.com/contents/find_store.html
① selenium을 이용해 주소탭 클릭 후 검색할 주소 값 입력 및 돋보기 클릭

→ '서울' 이라는 검색 키워드는 범위가 넓어 검색이 불가하므로 각 구별로 검색
→ 그 중 '강서구'와 '중구' 또한 위와 같은 이유로 검색이 불가해 '서울 강서', '서울 중구' 키워드로 변경하여 검색
② beautifulsoup을 이용해 주소 크롤링

③ 크롤링한 데이터 중 하위 도로명 주소까지 크롤링 되지 않는 값 발견

④ 하위 도로명 주소까지 크롤링 되지 않은 지점들을 매장명을 이용하여 크롤링 재수행

⑤ 크롤링한 데이터를 이용가능한 주소 형태로 가공 및 데이터프레임 저장

구 별 각 매장 수 합계를 비교하여 시각화

→ 서울시의 각 구 마다 스타벅스와 이디야 매장수의 합계를 그래프로 시각화 한 결과 마포구와, 송파구, 영등포구를 제외한 나머지 구들은 구 별 매장 분포 차이가 많이 났지만, 위 그래프로는 두 브랜드의 위치적 관계를 파악하기에 어려움이 있다.
도로명 주소를 이용하여 위도, 경도를 반환받고, 이를 이용해 직선거리를 계산 후 같은 구 내에 있는 두 매장의 위치 차이 분석

스타벅스 매장에서 2km 보다 더멀리 떨어진 이디야 매장은 분석에서 제외

pivot_table()을 이용해 각 구의 스타벅스로부터 직선거리 기준 가장 가까운 이디야 매장을 찾고, 100m/300m/500m/700m 이내에 포함되는 개수 비율을 구하여 비교



두 브랜드 지점별 거리가 2km 이내 매장을 기준으로 100m/300m/500m/700m 이내에 있는 이디야 매장 비율을 구하고 관계 분석

구 별 매장을 지도로 시각화하여 분석

"이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다."