[4주차] 서울시 CCTV 현황 (3)

이철민·2023년 2월 27일
0

[서울시 인구현황 & CCTV 데이터 합치기]

  • pands에서 데이터 프레임을 병합하는 방법
    • pd.concat()
    • pd.merge()
    • pd.join()
  • 데이터 병합 연습
  • pd.merge()
    • 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법
    • 기준이 되는 컬럼이나 인덱스를 키 값이라고 한다
    • 기준이 되는 키 값은 두 데이터 프레임에 모두 포함되어 있어야 한다
  • 컬럼의 기준을 key로 두고 공통된 것만 출력
    • pd.merge(left, right, how='inner', on='key'
  • left의 키 값을 기준으로 병합
    • pd.merge(left, right, how='left', on='key'
  • key 값을 기준으로 합집합, 모두 다 출력
    • pd.merge(left, right, how='outer', on='key'

  • 년도별 데이터 컬럼 삭제 : del, drop
  • del
    • del data_result['2013년도 이전']
  • drop
    • data_result.drop(['2015년', '2016년'], axis=1, inplace=True)
  • 인덱스 변경

    • set index
    • 선택한 컬럼을 데이터 프레임에 인덱스로 지정
    • data_result.set_index('구별', Inplace=True)
  • 상관계수

    • corr( ): correlation의 약자
    • 상관계수가 0.2 이상인 데이터를 비교하자

  • data_result['CCTV비율'] = data_result['소계'] / data_reuslt['인구수']
  • data_result['CCTV비율'] = data_result['CCTV비율'] * 100
  • data_result.sort_values(by=='CCTV비율', ascending=False).head()

[matplotlib 기초]

  • matplotlib 그래프 기본 형태
    • 배경 도화지 설정( 가로축 10 크기, 세로축 6 크기)
    • plt.figure(figsize=(10,6)
    • plt.plot(x,y)
    • plt.show
  • 연습)

  • 예제1) 그래프 기초 (삼각함수 그리기)
    • np.arrange(a, b, s): a부터 b까지 s 간격으로
    • np.sin(value)

-> # 범례, 주황색, 파란색 선 데이터 의미 구분, (loc='') 통해 위치 조정 가능

  • 예제2) 그래프 커스텀

  • 예제 3) scatter plot

  • 예제 4) pandas에서 plot 그리기
    • matplotlib 을 가져와서 사용

  • 그래프를 가로 형태로 만들고 싶다면? (bar 대신 barh)
    • data_result['인구수'].plot(kind='barh', figsize=(8,8))
profile
늘 온 마음을 다해 :)

0개의 댓글