EDA(7)_서울시 CCTV 분석 프로젝트 : 데이터 합치기(실습)

Jio.B·2023년 7월 3일
0

- (참고) jupyter notebook

  • docstring ---> shift + tab
  • 셀 추가(상단) ---> A
  • 셀 추가(하단) ---> B

데이터 합치기 (실습)

  • Pandas에서 데이터프레임을 병합하는 방법
  1. pd.concat( )
  2. pd.merge( A, B ) A: 데이터셋1, B: 데이터셋2
  3. pd.join( )

pd.merge( )

  • 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법
  • 기준이 되는 컬럼이나 인덱스를 "키값"이라고 한다.
  • 기준이 되는 "키값"은 두 데이터 프레임에 모두 포함되어 있어야 한다.
  1. merge( ) 사용에 앞서 데이터프레임 만들기

< 데이터 프레임 만드는 방법 >

  • 딕셔너리 안의 리스트 형태 { [ ] } : 컬럼(열) 값 기준으로 셋팅
  • 리스트 안의 딕셔터리 형태 [ { } ] : 인덱스(행) 값 기준으로 셋팅


1. 데이터 병합(merge)

2. 불필요한 컬럼 삭제(del, drop)

3. 인덱스 변경(set_index) = 인덱스 재설정

4. 상관계수 구하기(corr)
단, 상관계수 구하기 전에 데이터 타입 먼저 확인(info)

5. 분석에 필요한 새로운 칼럼 만들기

6. 새로운 칼럼 기준으로 다시 정렬(sort_values)
내림차순, 오름차순 비교해가며 살펴보기

0개의 댓글

관련 채용 정보