코딩 없이 pandas 예쁘게 시각화 하기

hsh·2021년 8월 16일
1
post-thumbnail
  • jupyter notebook을 활용하여 pandas dataframe을 간단하게 시각하기 위해서는 정말 많은 귀찮은 과정을 거쳐야한다.

  • matplotlib을 사용해서 한땀 한땀 그래프 설정을 만들고 건드는 것은 정말 짜증나고 귀찮은 일이다.

  • 이럴 때 쓸 수 있는 여러 시각화 툴을 정리해봤다.

Lux

https://github.com/lux-org/

  • lux를 활용한다면 import lux 한 줄 추가로 pandas 데이터 프레임을 매우 편하게 시각 화 할 수 있다.
import pandas 
import lux
df = pd.read_csv("https://raw.githubusercontent.com/lux-org/lux-datasets/master/data/college.csv")
df
- 칼럼들을 Lux 내부에서 정의한 데이터 타입(id, temporal, geo, 등)으로 분류하여 상관관계를 파악할 수 있게 하는 차트, 칼럼별 분포 등을 한번에 파악할 수 있는 그래프를 뽑아준다.

D-Tale

https://github.com/man-group/dtale


import pandas as pd
import dtale

df = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv")
dtale.show(df)
  • 통계 툴인 SAS를 python로 conversion하기 위해 만들어 졌다고 한다.
  • Lux에 비해 훨씬 많은 기능이 있다.
  • 기능이 복잡한 만큼 쓰기도 힘들 것 같음..
  • pycharm에서 쓸 수 있고 README 자세하게 있음

bamboolib

  • https://bamboolib.8080labs.com/
  • 기본 기능은 무료이지만, 유료로만 쓸 수 있는 기능도 있음
  • 일부 기능이 유료라는 것이 찝찝하다..

Deepnote

PandasGUI

  • https://github.com/adamerose/PandasGUI
  • 코딩 없이 쓰기에 제일 쉽고 말그대로 df에 대한 GUI가 생긴다
  • GUI를 통해 다양한 차트를 그릴 수 있고 정말 간편하다. 매우 추천..
  • 설치도 쉽고 무료이다
  • 단점은 데이터가 클 경우 정말 느리다... ㅜ_ㅜ
profile
Machine Learning Engineer: recsys, mlops

0개의 댓글