[시각화]Plotly를 활용한 시각화-1

염쟁이·2021년 1월 1일
0

데이터분석

목록 보기
1/1

Plotly

Plotly란?

Plotly는 Python으로 시각화를 할 수 있는 무료 오픈소스 그래프 라이브러리이다. Plotly JavaScript library기반으로 Jupyter notebooks에 표현하거나, Dash를 사용해서 분석 어플리케이션을 구축할 수 있다. (Dash부분은 나중에 더 알아보도록 하겠다.)
Plotly설명서를 참고하여 시각화 라이브러리를 Learning by Doing 해볼 것이다.

장점

  1. 코드의 간편함
    matplotlib보다 코드 자체가 가볍다. 물론 seaborn 또한 matplotlib보다는 단순하다. 아직 plotly를 접한지 며칠 되지 않았기 때문에 받아들이기에 편한 순서로는 seaborn > plotly > matplotlib이다.

  2. 색감
    개인적인 취향으로는 seaborn보다 plotly의 시각화가 더욱 보기가 좋다.
    하지만, seaborn에 만족한다면 굳이 plotly를 사용할 필요는 없을 것 같다.

설치

Windows에서 Jupyter Notebooks를 사용해서 실습을 진행하려고 한다. 2021-01-01 기준으로 plotly 버전은 4.14.1이다. 주피터노트북 버전 5.3이상, ipywidgets 버전 7.2이상이면 작동된다.

!pip install plotly==4.14.1

업그레이드가 필요할 경우는 다른 라이브러리 업그레이드 방식과 동일하게 입력해주면 된다.

!pip install plotly --upgrade

실습데이터

데이터

서울시 업종별 내외국인 신한카드 매출데이터
서울시 빅데이터 캠퍼스에서 찾은 신한카드 매출데이터이다. 해당 데이터를 활용해 가벼운 시각화를 진행해볼 예정이다.

  • 지역 : 서울 전역

  • 기간 : 2017.01 ~ 2020.10

  • 데이터 설명
    서울시 내에 위치한 가맹점의 카드이용 건을 대상으로 내국인은 개인카드(신용카드/체크카드) 및 법인카드 이용 내역을 포함하고, 외국인은 외국인의 카드이용 내역을 포함합니다. 단 “내국인(집계구) 유입지별”은 개인카드(신용카드/체크카드) 이용내역만 포함합니다.

    내국인의 매출금액과 매출건수는 블록 단위로 일/요일/시간대 별, 집계구 단위 일/성/연령 별, 일/유입지 별 63개 업종에 대하여, 외국인의 매출금액과 매출건수는 블록 단위로 일/시간대 별, 일/국가 별 56개 업종에 대하여 집계하였습니다.

    내국인 업종에서는 온라인거래, 세금공과금, 통신요금, 보험료, 대학등록금 등을 제외하였고, 외국인 업종에서는 온라인거래, 세금공과금, 통신요금, 보험료, 대학등록금, 가정생활서비스, 교육/학원 등을 제외하였습니다.

    빅데이터 캠퍼스에서 제공하는 본 데이터는 다른 기관에서 제공하는 데이터 보다 공간단위가 더 작은 집계구와 블록 단위로 제공하고 있습니다.

plots

Plotly 사용법 설명서를 참고하여 차트들을 활용해볼 것이다. 아직 구체적으로 어떤 시각화를 하면 좋을지는 생각하지 못했는데, 가볍게 EDA하는 느낌으로 실습해볼 예정이다.

profile
Learning by Doing

0개의 댓글