EDA 2 - Analusis Seoul Crime (3)

subinii·2024년 4월 9일

DS 25기

목록 보기
19/46
post-thumbnail

서울시 범죄 현황 데이터 분석 프로젝트

seaborn

설치 방법 : conda install -y seaborn

  • seaborn은 matplotlib과 함께 실행
  • seaborn에는 실습용 데이터가 몇 개 내장되어 있다
  • boxplot을 그려볼 수 있다. (컬럼을 지정해서 그릴 수 있다.)
  • palette option : 색상 지정
    - palette="Set1" (set1~3)
  • hue :카테고리 데이터 표현 (컬럼을 지정하고 구분을 지을 수 있다.)
  • swarmplot : 분포도 출력
  • lmplot : x값과 y값의 사이 관계 파악
  • pivot 옵션을 사용 가능
  • heatmap : 전체 경향을 알 수 있다.
  • colormap
  • pairplot : 다수의 컬럼을 비교, hue를 사용 가능, 원하는 컬럼만 선택 가능

예제 1 : seaborn 기초

  • sns.set_style() : "white", "whitegrid", "dark", "darkgrid"

예제 2 : seaborn tips data

data

boxplot



swarmplot

  • color : 0~1 사이 검은색부터 흰색 사이 값을 조절

boxplot whit swarmplot

implot


예제 3 : flights data

data

heatmap

  • annot=Ture 데이터 값 표시 / annot=False : 데이터 값 표시 X
  • fmt="d" 정수형 표현 / fmt="f" 실수형 표현

colormap

  • cmap 컬러는 공식 홈페이지에서 찾기 가능

예제 4 : iris data

data

pairplot

  • 원하는 컬럼 pairplot

예제 5 : anscombe data

data

  • ci 신뢰구간 선택
  • scatter_kws : 점의 크기 조절
  • order option
  • order=1은 직선 표현
  • order=2는 곡선 표현
  • robust=True : 이상점을 무시하고 회귀선 그리기

서울시 범죄현황 데이터 시각화

pairplot

  • 강도, 살인, 폭력에 대한 상관관계 확인
  • kind ="reg", "scatter", "kde", "hist"

heatmap

  • 검거율
  • "검거" 컬럼을 기준으로 정렬

“이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다.”

profile
데이터 공부 기록

0개의 댓글