[PYTHON] ✨시각화✨

Soo·2023년 10월 26일
0
post-thumbnail

관련 게시글

✏️ 종류

💡 matplotlib 라이브러리

  • python 프로그래밍 언어 및 수학적 확장 NumPy 라이브러리를 활용한 플로팅 라이브러리
  • https://matplotlib.org/
import matplotlib.pyplot as plt    
from matplotlib import rc  #폰트 설정
rc("font",family="Arial Unicode MS")

%matplotlib inline
#혹은 get_[python().run_line_magic("matplotlib","inline"]

plt.figure(figsize=(10,6))
plt.plot(X축, Y축)  #x축,y축
plt.show()

💡 seaborn 라이브러리

import seaborn as sns

💡 Matplotlib vs Seaborn 라이브러리

Matplotlib 는 지속적으로 개발되고 있는 인기 있는 플로팅 패키지. 수많은 렌더링 백엔드를 제공하고 장황한 구문을 사용하여 플롯에 높은 수준의 유연성과 사용자 정의 가능성을 제공

  • 그래프를 임의로 그려야 하는 경우
  • 고도로 맞춤화된 플롯을 생성하거나 seaborn 뒤에 있는 플로팅 도구를 배우려는 경우, Matplotlib 고려

seaborn 은 Matplotlib 위에 구축된 Python 플로팅 라이브러리. Matplotlib보다 더 보기 좋은 스타일 기본값으로 데이터 세트를 빠르게 시각화하는 간결하지만 제한된 접근 방식을 허용합니다.

  • DataFrame을 가지고 그리는 경우
  • 간결한 코드를 작성하고 더 짧은 시간에 더 매력적인 기본 스타일로 플롯(특히 통계 플롯)을 생성하려면 seaborn을 고려.

✏️ Seaborn

** plot 정리 : Seaborn - 데이터를 시각화하는 17가지 방법

목적TYPE
개수 또는 빈도막대 그래프 : barplot()
누적 막대 그래프 : countplot()
구간(이산)분포히스토그램 : histplot(), displot()
누적 확률 및 백분위수 추정누적 분포함수 : displot()
중위수, 사분위간 범위Box plot : boxplot()
Violin plot : violinplot(), catplot()
변수 간 관계Two variable : scatterplot(), stripplot()
Categorical : swarmplot(), catplot(), heatmap(), pairplot()
ex) heatmap : 상관계수
연속된 데이터선형 그래프 : plot()

💡 countplot()

1. seaborn.countplot

seaborn.countplot(data=None, *, x=None, y=None, hue=None, order=None, hue_order=None,
orient=None, color=None, palette=None, saturation=0.75, fill=True, hue_norm=None,
stat='count',width=0.8, dodge='auto', gap=0, log_scale=None,
native_scale=False,formatter=None, legend='auto', ax=None, **kwargs)

2. 예시

plt.subplots(figsize=(15, 6))
sns.countplot(data=DF이름, x='column명', palette='RdYlGn(컬러명)', 
              edgecolor=sns.color_palette('dark', 7))
plt.xticks(rotation=90)
plt.title('제목')
plt.show()

💡 seaborn을 위해 DF 바꾸기

* .melt(df, id_vars="기준", var_name="컬럼을 value로", value_name="value를 컬럼으로")

    class       men       woman   children
0   first   0.91468    0.667971   0.660562
1   second  0.30012    0.329380   0.882608
2   third   0.11899    0.189747   0.121259

▼▼▼▼▼▼

df = pd.melt(df, id_vars="class", var_name="sex", value_name="survival rate")
df
Out: 
    class       sex  survival rate
0   first       men       0.914680
1  second       men       0.300120
2   third       men       0.118990
3   first     woman       0.667971
4  second     woman       0.329380
5   third     woman       0.189747
6   first  children       0.660562
7  second  children       0.882608
8   third  children       0.121259

💡 palette

matplotlib 컬러명(color name), 팔레트(palette) 이름

  • 색상을 반대로 하고 싶다면 : 색상 뒤에 _r붙이기

✏️ 출처

파이썬 데이터분석을 위한 시각화 라이브러리(matplotlib, seaborn,etc)
[Python] Seaborn 패키지 - countplot(), rugplot()
Python >> Seaborn - (1) Seaborn을 활용한 다양한 그래프 그리기

profile
데린이인데요 ໒꒰ྀ ˶ • ༝ •˶ ꒱ྀིა (잘못 된 부분은 너그러이 알려주세요.)

0개의 댓글

관련 채용 정보