Data Science - 정적 시각화 (Seaborn)

cosmosJ·2024년 2월 18일

데이터 분석

목록 보기
23/26
post-thumbnail

Seaborn

Matplotlib을 기반으로 하며, 다채로운 디자인 테마와 통계에 특화된 통계용 차트를 쉽고, 빠르게 사용할 수 있는 강력한 시각화 라이브러리

  • 한 줄의 코드로 다양하고, 복잡한 그래프를 구현할 수 있는 특징을 가짐
    import seaborn as sns

Seaborn의 특징

  1. 간결한 한줄 코드로 쉽고 간단하게 복잡한 그래프 구현

    • 단, 변수가 추가될 수록 메모리 부족 이슈 발생 & 가독성 떨어짐
    • matplotlib를 여러 줄의 코드가 필요하지만, 필요한 부분만 이용하여, 필요한 공간에 최적화한 시각화가 가능하다.
  2. 통계 시각화 특화 (고수준 API 제공)

    • 통계 패키지인 statsmodels의 통계 기능을 활용하여, 쉽게 시각화 가능

      • jointplot을 포함한 여러 플롯 메소드에서 statsmodels를 기반하여 데이터 분포를 시각화 한다.
    • 간단한 명령어로 통계적으로 복잡한 연산이 수행되는 기능을 쉽게 구현 가능

  3. 데이터에 적합한 다채로운 시각화 기능 제공

    • 다채로운 테마로 빠른 정보 전달
    • ex. 복잡한 pivot table를 직관적인 히트맵으로 표현 가능

Seaborn 그래프 그리기

다양한 그래프 옵션과 종류를 제공하여, 데이터마다 최적화된 그래프를 그릴 수 있다.

import seaborn as sns

sns.scatterplot(x='', y='', hue='범주', data='')
  • 만약, Matplotlib을 사용했다면, hue가 없어, 범주형 변수별 데이터를 따로 입력해야 한다. (범주별 산점도를 만들기가 복잡하다.)

실습 코드

profile
백엔드, Data Science, AI 분야 학습 내용을 정리하는 블로그입니다.

0개의 댓글