241023 TIL

mj_data·2024년 10월 23일

TIL

목록 보기
23/32

파이썬 문법

MERGE

Pandas의 문법 중 하나인 merge는 SQL 구문의 join과 유사하다.

# how를 통해 merge 방법을, on을 통해 기준열을 선택한다.
# 기준열의 이름이 각각 다를 경우 left_on, right_on 사용

merge_df = pd.merge(df2,df3, how='inner', left_on = 'Customer ID', right_on = 'user id')

JOIN

인덱스 기준으로 테이블을 병합한다.

# 마찬가지로 how를 통해 join 방법을 선택한다.
# index를 기준으로 병합하다보니 칼럼 이름이 겹칠 경우 lsuffix, rsuffix로 문자열을 부여할 수 있다.

df.join(df2,how='left', lsuffix='1', rsuffix='2')

CONCAT

데이터프레임 또는 시리즈를 특정 축을 따라 연결하는 데 사용한다. 수직결합, 수평결합을 택할 수 있다.

# axis=0(디폴트)을 통해 행 기준으로 밑으로 붙이거나 axis=1을 통해 열 기준으로 오른쪽으로 붙일 수 있다.
# ignore_index=True를 통해 인덱스를 재배열할 수 있고 join='inner'를 통해 null값을 제외한 교집합만 결합할 수 있다.

pd.concat([df2, df3], axis=0, ignore_index=True, join='inner')

APEND

데이터프레임에 행을 추가한다.

# df 밑에 df2를 붙일 수 있다.

df.append(df2)

0개의 댓글