seaborn 라이브러리

yulsikogi·2024년 2월 27일
post-thumbnail

데이터를 시각화하는데 있어서, matplotlib 라이브러리만으로 부족한 부분이 있다. 그래서 이를 보완하기 위해 matplotlib에 기반을 둔 seaborn 라이브러리가 있다. 지금부터 자세하게 알아보도록 하겠다.

seaborn 라이브러리란?

그래프를 더 아름답고 복잡하게 만드는 데 중점을 둔 라이브러리.
통계적 데이터 시각화를 쉽고 직관적으로 만들 수 있다.

특징

1. 아름다운 기본 스타일과 색상 팔레트

  • Seaborn은 matplotlib의 기본 스타일보다 더 세련되고 현대적인 시각적 표현을 제공한다.
  • 또한, 데이터의 패턴을 더 잘 강조하는 색상 팔레트를 사용한다.

2. 통계적 데이터 시각화에 중점

  • Seaborn은 평균, 중앙값, 분포 등과 같은 통계적 개념을 시각화하는 데 특화되어 있다.

3. DataFrame 통합

  • Pandas의 DataFrame과 긴밀하게 통합되어 있어, 복잡한 데이터 구조를 쉽게 시각화가 가능하다.

4. 다양한 시각화 유형

  • 회귀선이 있는 산점도, 히스토그램, 박스 플롯, 바이올린 플롯, 히트맵 등 다양한 종류의 그래프를 지원한다.

5. 쉬운 데이터 집계 및 표현

  • 복잡한 데이터 집계나 표현이 필요한 경우에도 Seaborn은 사용하기 쉬운 인터페이스를 제공한다.

6. matplotlib과의 호환성

  • Seaborn은 matplotlib 위에서 작동하므로, matplotlib의 기능을 직접 사용하거나, 세부적인 조정을 위해 Seaborn과 matplotlib을 혼합하여 사용이 가능하다.

countplot() 메소드

Seaborn 라이브러리에서 제공하는 메소드 중 하나로 자주 사용된다. 주로 범주형 데이터의 빈도수를 시각화하는데 사용한다.

사용예시

import seaborn as sns
sns.countplot(x='AgeGroup', hue='HeartDisease', data=heart_data)


기본적으로 3가지 속성을 사용했다. 가장 기본은 2가지로 x와 data다.

  1. x 속성: 시각화하고자 하는 DataFrame의 열 이름
  2. data 속성: 해당 데이터 프레임
  3. hue 속성: 데이터의 서브그룹에 따른 빈도수를 다른 색상으로 나타냄

마무리

seaborn 라이브러리는 'matplotlib + @' 개념이다. 그렇기 때문에 matplotlib 라이브러리만 사용하기보다는 seaborn 라이브러리도 함께 사용하면서 다양하게 데이터를 시각화 할 줄 알아야 한다.

profile
Let's enjoy it. For me

0개의 댓글