[KT Aivle AI]2주차. DataFrame결합

hyowon·2024년 3월 19일
0

KtAivle

목록 보기
6/39

0. 개요

  • 주제 : DataFrame 변경
  • 내용 : DataFrame 결합하는 부분에 대한 정리이다.

1. 데이터 프레임 결합

1) 데이터 프레임을 결합하는 두 가지 방법

(1) pd.concat()

  • 매핑 기준 : 인덱스(행), 칼럼이름(열)
    구조가 같아야 합칠 수 있다.
    방향 선택
    axis=0 : 세로(행)로 합치기 (Default)
    axis=1 : 가로(열)로 합치기

  • 방법 선택
    join=’outer’ : 모든 행과 열 합치기 (Default)
    join=’inner’ : 매핑되는 행과 열만 합치기

(2) pd.merge() -> 진짜 많이 쓰인다. 중요!!!!

매핑 기준 : 특정 칼럼(key)의 값 기준으로 결합
데이터베이스 테이블 조인과 같음

merge는 무조건 옆으로 붙인다 (inner/outer/left/right join)

✍ 입력

df1 = pd.DataFrame({'A':[1,2], 'B':[15,30], 'C':[20, 25]})
df2 = pd.DataFrame({'A':[2,3], 'D':[20, 35]})

display(df1)
display(df2)

- inner merge : 대부분 이거 사용!!

pd.merge(df1, df2, how = 'inner', on = 'A')

- left merge

pd.merge(df1, df2, how = 'left')

-right merge

pd.merge(df1, df2, how = 'right')

2) pivot

  • Pivot 함수를 이용하여 집계된 데이터를 재구성
    df.pivot(index, column, values)
    Pivot은 DataFrame을 결합시키는 것은 아니지만, 구조를 변형시키는것.
    먼저 groupby로 집계하고, pivot(index, column, value)
profile
안녕하세요. 꾸준히 기록하는 hyowon입니다.

0개의 댓글