[python] 데이터프레임 합치기 - pd.merge() , pd.concat()

eun·2022년 9월 12일
0

python

목록 보기
3/4
post-thumbnail

pd.merge()

공통의 열(key)을 기준으로 두 프레임을 병합(join)
= SQL 의 JOIN 역할

1) 기준열 이름이 같을 때

pd.merge(left,
		 right, 
         on = '기준열', 
         how = '조인방식')
  • left : 왼쪽 데이터프레임
  • right : 오른쪽 데이터프레임
  • on : 기준열 (SQL의 ON과 동일)
  • how : 조인 방식 ( default = inner )
    ( 종류 : left, right, inner, outer )

2) 기준열 이름이 다를 때

pd.merge(left,
		 right,
		 left_on = '왼쪽 열',
         right_on = '오른쪽 열',
         how = '조인방식')
  • left_on : 기준열 이름이 다를 때, 왼쪽 기준열 이름
  • right_on : 기준열 이름이 다를 때, 오른쪽 기준열 이름

pd.concat()

여러 데이터프레임을 하나의 데이터프레임으로 합칠 때
= SQL 의 UNION 역할

pd.concat([df1, df2])

pd.concat([df1, df2, df3], join = 'inner')
  • axis=0 : 위 / 아래 로 데이터 합치기 (default)
  • axis=1 : 왼쪽 / 오른쪽 옆으로 데이터 합치기
  • join : 조인방법 ( default = outer / inner 는 교집합만 concat )
  • ignore_index=True : 기존 index 무시 (option)
profile
study archive 👩‍💻

0개의 댓글