데이터 시각화 - 정적 시각화 Matplotlib vs Seaborn

hisungmi·2024년 8월 30일
0

KT Aivle

목록 보기
22/23
post-thumbnail

데이터 시각화

  • 직관적으로 정보를 확인하는 효과적인 방법

    적절한 그래프 유형 선택과 옵션 활용이 중요

데이터 시각화 이유

Visual Explanation vs Text Explanation

  • Anscombe 예제: 기술 통계 vs 데이터 시각화

그래프 구성 요소

  • 그래프를 구성하는 요소와 방식을 안다면 다양하게 활용 가능

    figure : 도화지 (그림전체)
    axes : 도화지 내 plot이 그려지는 공간
    axis : plot의 축 -> x, y


파이썬 시각화 라이브러리

MatplotlibSeaborn
기능파이썬의 기본적인 시각화 라이브러리통계 시각화에 특화
디스플레이기본적이고 단순한 디스플레이다채로운 시각화 가능
복잡도한 줄의 코드로 복잡한 그래프 구현 어려움쉽고 간단하게 복잡한 기능 구현
다중성여러 개의 시각화 가능다중 시각화 어려움(메모리 부족 이슈)
유연성유연한 인터페이스 제공유연성이 상대적으로 떨어짐

Matplotlib

  • 파이썬의 가장 인기 있는 데이터 시각화 라이브러리, 2D 형태의 그래프와 이미지를 그릴 때 많이 사용

    pyplot 모듈을 많이 사용, 주로 plt라는 별칭 이용하여 호출
    import matplotlib.pyplot as plt

Matplotlib 특징

  • 유연한 인터페이스
    plt.plot(기간, 변수1), plt.plot(기간, 변수2)

그래프 그리기

plt.figure() # 새로운 그래프를 담을 도화지 생성
plt.plot() #데이터 시각화 기능, 그래프 유형과 변수설정 가능
plt.show() #그래프 출력

그래프 구성 요소 > pyplot을 이용하면 figure, axes, axis 쉽게 조작 가능

import matplotlib.pyplot as plt
plt.figure()
plt.plot([0,1,2,3,4,5],[0,1,2,3,4,5])
plt.title('라인 그래프')
plt.ylabel('y축')
plt.xlabel('x축')
plt.show()

여러 그래프 그리기

  • 여러 개의 그래프를 하나의 figure에 담는다면 한번에 더 많은 정보를 효과적으로 전달할 수 있음

    Matplotlib의 pyplot 모듈에서는 subplot과 subplots 커맨드를 활용하여 여러 그래프 구현 가능

pyplot의 subplot

  • 여러 개의 axes를 하나의 도화지에 그릴 수 있음

    plt.subplot(row, colum, index)

pyplot의 subplots

  • axes객체의 twinx 메소드를 이용하면 x축을 공유하는 두 개의 그래프를 동시에 그릴 수 있음

    하나의 ax에 두 종류 그래프, 같은 x축을 공유, 다른 y축 사용


Seaborn

  • Matplotlib을 기반으로 하며 다채로운 디자인 테마와 통계용 차트 등이 추가된 강력한 시각화 라이브러리

    한 줄의 코드로 강력한 시각화 가능
    import seaborn as sns


Seaborn 특징

  • 간결한 한 줄 코들도 쉽고 간단하게 복잡한 기능 구현

  • 통계 시각화에 특화 고수준 API

  • 데이터에 적합한 다채로운 시각화 기능 제공

그래프 그리기

  • 다양한 그래프 종류와 인수로 효과적인 시각화 가능
import seaborn as sns
sns.scatterplot(x ='변수명', 
				y='변수명', 
                hue='범주형 변수명', 
                data= 데이터 이름)
profile
난 성미다.

0개의 댓글