09/07

채언·2022년 9월 7일
0

1. 서울시 구별 CCTV 수와 인구수 데이터 합치기

  • crime 데이터에, CCTV 데이터셋의 총 인구수 컬럼과 총 CCTV 수의 컬럼을 추가한다.

2. pairplot 을 통해 상관관계 보기

sns.pairplot(data=crime,vars=['살인','강도','폭력'],kind = 'reg', height=3)
plt.show()

sns.pairplot(data=crime,vars=['살인','강도','폭력'],kind = 'scatter', height=3)
plt.show()

sns.pairplot(data=crime,vars=['살인','강도','폭력'],kind = 'kde', height=3)
plt.show()

sns.pairplot(data=crime,vars=['살인','강도','폭력'],kind = 'hist', height=3)
plt.show()

  • pairplot 의 옵션, kind 를 바꾸면 그래프의 형태를 바꿔서 볼 수 있다.
  • 가장 흔하게 보는 타입은, reg로 상관관계를 보는것이다.
sns.pairplot(data=crime,
x_vars=['인구수','CCTV 수'],
y_vars=['살인','강도'],
kind = 'reg',
height=4)
plt.show()

sns.pairplot(data=crime,
x_vars=['인구수','CCTV 수'],
y_vars=['살인검거율','폭력검거율'],
kind = 'reg',
height=4)
plt.show()

  • x,y 축에서 비교해볼 값을 설정하고, 원하는 값과의 상관관계를 비교해 볼 수있다. (matplotlib의 한글설정에 오류가 있어, 그래프 표출시에 한글이 깨져나왔다.)

3. 지역별 검거율을 heatmap을 통해 한눈에 보기

target = ['강간검거율','강도검거율','살인검거율','절도검거율','폭력검거율','검거']
crime_sort = crime.sort_values(by='검거',ascending=False) # 내림차순 정렬

plt.figure(figsize=(10,10))
sns.heatmap(
    data=crime_sort[target],
    annot=True, # 히트맵 상자 속에 데이터 값 표현함
    fmt='f', # 상자속 숫자 실수로 표현
    linewidth=0.5, # 상자와 상자 사이 간격 0.5 로 줌 
    cmap='RdPu' # 테마 빨간색 설정
)
plt.title("범죄 검거 비율")
plt.show()

  • 타겟 이라는 리스트를 만들어서, 보고싶은 컬럼의 값들만 작성한후 데이터 프레임에 그 리스트값을 넣으면 그 값에 대해서만 볼 수 있다.
profile
화이팅!

0개의 댓글