[Excel초격차] 따릉이 대여소별 대여량 분석(averageifs,sumifs,지도시각화)

Hyejin Beck·2023년 12월 27일
0

Excel & Sheet

목록 보기
14/22

이용 정보 분석

3개의 raw데이터

  • 이용 정보(시간대별)
  • 대여소 정보
  • 대여소별 이용정보 (월별)



피벗테이블

기본

  • 성별 이용건수
  • 연령대별 이용건수
  • 시간대별 이용건수 등등 기본 차트들을 만들어줍니다.

그리고 그에 따른 시각화 차트들도 만들어줍니다.

평균

  • 대여일자별 운동량,탄소량,이동거리,사용시간 평균을 구해줍니다.
    =averageifs() 를 이용합니다.
    =averageifs(평균 찾을 열 , 범위 , 기준 )
    =averageifs(운동량 , $대여$일자 , $원하는날짜 )



시각화

  • 산점도와 박스플롯으로 시각화 합니다.

박스플롯의 경우
빈 박스플롯을 만듬 > 데이터 선택 > + 눌러서 추가 >
x 에는 탄소량 범위
y 에는 운동량 범위

대여소 분석

대여소 코드 추출

  • 한 달 동안 사람들이 이용한 정류소를 알기 위해
    공공자전거 이용정보(시간대별) 에서 정류소만 복붙해준 뒤, 중복값 제거 해줍니다.
    데이터 > 중복된 항목 제거

  • 대여소명에 있는 . 을 제거해줍니다.
    =left ( $찾는값, find(".", $찾는값 ) -1 ) 을 통해
    왼쪽 기준으로 . 바로 전 텍스트 숫자
    예를들어, 123.어쩌구 가 있다면 123 이니까 3만 추출합니다.

  • . 이 없어서 오류가 뜨는 경우 : 필터로 오류값이 몇 개인지 확인합니다. 4개밖에 없군요! 여기서는 삭제 하겠습니다.




자치구 코드 추출

  • vlookup으로 추출한 대여소 코드에 맞는 자치구를 가져옵니다.
    =vlookup($대여소코드, $자치구$포함범위, 자치구있는열번호, 0

  • 대여소명, 위도, 경도도 가져옵니다.

  • 0 값들은 모두 제거 하겠습니다. (몇 개 안됨)

  • 2021년 1월 이용건수도 확인하는 새 열도 만들겠습니다.
    =sumifs() 를 사용합니다.
    =sumifs( $대여$건수, $대여$일자, $$202101 , $대여소$코드 )

=SUMIFS(
'공공자전거 대여소별 이용정 _2020.07_2021.01'!$D:$D,
'공공자전거 대여소별 이용정보_2020.07_2021.01'!$A:$A,
'서울시 지도 시각화(실습2)'!$B2,
'공공자전거 대여소별 이용정_2020.07_2021.01'!$C:$C,
'서울시 지도 시각화(실습2)'!G$1)

각 대여소코드 별 202101 날짜의 이용건수 를 알아보자.

=sumif(
이용 건수 목록
대여소 코드 목록
대여소 코드 하나
날짜 목록
날짜 하나
)


지도 시각화

  • 분산형 : 경도와 위도에 따른 정류소 시각화
    삽입 > (빈)분산형 > 데이터 추가 > 계열 추가 > 이름은 아무거나 , x는 경도, y는 위도
  • 거품형 : 대여량에 따른 정류소 시각화
    삽입 > (빈) 거품형 > 데이터 추가 > 계열 추가 > 이름은 아무거나, x는 경도, y는 위도 , 계열 거품크기는 202101의 이용건수
    그리고 거품 오른쪽마우스 > 데이터 계열 서식 > 거품 크기 배율을 10~20 으로 수정
    그리고 데이터계열서식 > 채우기 > 단색 채우기 > 투명도 50% 로 조절




profile
데이터기반 스토리텔링을 통해 인사이트를 얻습니다.

0개의 댓글

관련 채용 정보