- Seaborn
- Seaborn Parameter
- Seaborn API
- Categorical API
- Distribution API
- Relational API
- Regression API
- Matrix API
!pip install seaborn==0.11
import seaborn as sns
- seaborn 공통 파라미터 종류
- x : x축 feature (세로 막대)
- y : y축 feature (가로 막대)
- data : dataframe
- hue : 데이터의 구분 기준을 정하여 색상을 통해 내용을 구분
- hue_order : 색상 순서 정렬
- palette : 색상 변경
- color : hue 그룹에 Gradient 색상을 전달
- saturation : 채도(많이 사용하진 않음)
- ax : ax subplot 지정
data.describe()
커스텀 가능 요소
- width : 박스 너비
- linewidth : 선 두께
- filtersize : 이상치 점 크기
오해를 줄이기 위한 파라미터
- bw : 분포 표현을 얼마나 자세하게 보여줄 것인가
- 'scott', 'silverman', float
- cut : 끝부분을 얼마나 자를 것인가?
- float
- inner : 내부를 어떻게 표현할 것인가
- "box", "quartile", "point", "stick", None
- scale : 각 바이올린의 종류(데이터의 크기 반영 방법)
- "area", "count", "width"
- split : 동시 표현 가능
범주형/연속형 모두 살펴볼 수 있는 분포 시각화
단일 변수 분포 확인
- plot 종류
- histplot : 히스토그램
- kdeplot : kernel Density Estimate
- ecdfplot : 누적밀도함수
- rugplot : 선을 사용한 밀도함수
seaborn에서는 막대가 아닌 다른 모양도 만들 수 있음
n개의 분포 표현 또한 가능
연속확률밀도를 보여주는 함수
fill='True'
를 통해 내부를 채워 표현하는 것을 추천
-> 단순히 선만 그려서는 정보 전달이 어려울 수 있기 때문
bw_method
를 사용하여 분포를 더 자세하게 표현 가능style_order, hue_order, size_order
로 순서 조절 가능order
파라미터를 통해 다차원 회귀선도 그릴 수 있음 vmin, vmax
로 범위 조정center
로 범위 중간 지정cmap
을 통해 가독성 향상annot, fmt
를 사용해 실제 값에 들어갈 내용 작성 가능linewidth
를 사용하여 칸 사이 나눌 수 있음square
를 사용하여 정사각형 사용 가능