Pandas (8)

tino-kim·2022년 1월 4일
0
post-thumbnail

🥴 Pandas (8)

📌 DataFrame 합치기

단순하게 DataFrame 합치기.

  • concat

특정 고유 키 값을 기준으로 병합하기.

  • merge

📌 concat

  1. 행을 기준으로 붙이기.
  2. 열을 기준으로 붙이기.
1. df_concat=df.concat([df1, df2], axis=0, sort=False)
# 인덱스 정보를 제거하고 싶은 경우
df_concat.reset_index()
df_concat.reset_index(drop=True)
2. df_concat=df.concat([df1, df2], axis=1)
# 행의 개수가 맞지 않는 경우에는 그 자리에 NAN이 들어간다
  • sort = False
    행 기준으로 붙이는 경우에 무조건 붙여주기.
  • drop = True
    인덱스의 정보를 없애고 싶은 경우에 무조건 붙여주기.

📌 merge

pd.merge(left, right, on='기준이 되는 칼럼명', how)
  • how='right'
    오른쪽 기준으로 병합한다.
  • how='left'
    왼쪽 기준으로 병합한다.
  • how='inner'
    교집합을 의미한다.
  • how='outer'
    합집합을 의미한다.

if. column명은 다른데, 동일한 데이터인 경우

df.merge(left, right, left_on, right_on, how)
  • left_on
    left의 데이터는 어느 기준으로 통합하는지 알려준다.
  • right_on
    right의 데이터는 어느 기준으로 통합하는지 알려준다.

😀 마무리...

  • concat
    단순하게 병합하는 경우에 사용한다.
    sort = False : 행을 병합할 때, 이용하기
    drop = True : 인덱스 칼럼을 제거할 때, 이용하기.
pd.concat([df1,df2])
  • merge
    고유의 키 값 기준으로 병합하는 경우에 이용한다.
pd.merge(left, right, on, how)

if. 칼럼명이 다른 경우

pd.merge(left, right, left_on, right_on, how)

how에는 "right", "left", "inner", "outer"가 있다. 필요한 것을 잘 골라서 이용하기~!

profile
알고리즘과 웹 개발과 데이터 과학을 공부하는 대학생

0개의 댓글