[부스트캠프 AI-Tech] 5주차 Day 4

LKM·2022년 2월 21일
0

✏️학습 정리


6-1. Interactive Visualization

  • Why Interactive?

    • 정적 시각화 단점

      • 공간적 낭비 크다. (feature가 10개 → 각각의 관계 45개 plot 필요)

      • 각각의 사용자는 원하는 인사이트가 다를 수 있다.

        —> plot이 많고 보고 싶은 feature가 정해지면 interactive 시각화

    • Interactive 종류

      • Select, Explore, Reconfigure, Encode ... 등
    • 라이브러리

      • Ploty
      • Bokeh
      • Altair
    • 하지만 Interactive는 진짜 필요할 때만 사용하자! (과하게 사용하면 속도만 느려질 뿐 생산성이 떨어진다.)

  • Interactive Viz Library

    • Matplotlib

      • 주피터 환경 또는 Local에서만 실행 (다른 라이브러리는 웹에 deploy 가능)
    • Plotly

      • 가장 많이 사용되는 라이브러리
      • 예시 + 문서화가 잘되어 있음
      • 웹에서 사용 가능
    • Plotly Express

      • seaborn과 유사하게 만들어 쉬운 문법
      • 커스텀이 부족하지만 다양한 함수 제공
    • Bokeh

      • Matplotlib과 문법이 유사
      • 비교적 부족한 문서화...
    • Altair

      • 데이터 크기에 5000개 제한
      • Bar, Line, Scatter, Histogram에 특화



6-2. Plotly Express

  • Plotly Express

    • plotly 단순화 버전
    • 유연한 input (list, dict, Dataframe 등...)
    • 적절한 color encoding
  • 기본 플롯

    • Scatter
      • px.scatter(x, y, size, color) : seaborn과 유사하게 4가지 사용

      • range_x, range_y : set_xlim과 같이 축의 범위 설정

      • marginal_x, marginal_y : 각 축의 분포 확인 가능

      • trendline : 회귀선

      • facet_col, facet_row : Facet Grid 기능 포함

    • Line
      • px.line(x, y, color)
    • Bar
      • px.bar(x, y, color)
      • barmode : stack, group으로 bar 모드 변경
  • 다양한 차트

    • px.sunburst(path, values) : 계층 구조 표현
    • px.treemap(path, values) : 계층 구조 표현
    • px.scatter_3d(x, y, z, symbol, color) : 3d 표현 (scatter)
    • px.parallel_coordinates, px.parallel_categories : 다차원 데이터 시각화
    • px.scatter_geo , px.choropleth : 지도 데이터 표시



7-1. Custom Matplotlib Theme

  • 색 선정

    • cycler를 기본으로 사용하여 전체적인 color palette를 바꿀 수 있다.
    • mpl.rcParams[’색을 바꿀 요소’] = cycler(’color’, custom_palette)
  • 예제 코드 확인



7-2. Image & Text Viz Tech

profile
함께 자라기

0개의 댓글