[KT Aivle AI]2주차. DataFrame결합

hyowon·2024년 3월 19일
0

KtAivle

목록 보기
6/39

0. 개요

  • 주제 : DataFrame 변경
  • 내용 : DataFrame 결합하는 부분에 대한 정리이다.

1. 데이터 프레임 결합

1) 데이터 프레임을 결합하는 두 가지 방법

(1) pd.concat()

  • 매핑 기준 : 인덱스(행), 칼럼이름(열)
    구조가 같아야 합칠 수 있다.
    방향 선택
    axis=0 : 세로(행)로 합치기 (Default)
    axis=1 : 가로(열)로 합치기

  • 방법 선택
    join=’outer’ : 모든 행과 열 합치기 (Default)
    join=’inner’ : 매핑되는 행과 열만 합치기

(2) pd.merge() -> 진짜 많이 쓰인다. 중요!!!!

매핑 기준 : 특정 칼럼(key)의 값 기준으로 결합
데이터베이스 테이블 조인과 같음

merge는 무조건 옆으로 붙인다 (inner/outer/left/right join)

✍ 입력

df1 = pd.DataFrame({'A':[1,2], 'B':[15,30], 'C':[20, 25]})
df2 = pd.DataFrame({'A':[2,3], 'D':[20, 35]})

display(df1)
display(df2)

- inner merge : 대부분 이거 사용!!

pd.merge(df1, df2, how = 'inner', on = 'A')

- left merge

pd.merge(df1, df2, how = 'left')

-right merge

pd.merge(df1, df2, how = 'right')

2) pivot

  • Pivot 함수를 이용하여 집계된 데이터를 재구성
    df.pivot(index, column, values)
    Pivot은 DataFrame을 결합시키는 것은 아니지만, 구조를 변형시키는것.
    먼저 groupby로 집계하고, pivot(index, column, value)
profile
안녕하세요. 꾸준히 기록하는 hyowon입니다.

0개의 댓글

관련 채용 정보