판다스 기초 8. concat

도로롱·2022년 10월 15일
0

pandas

목록 보기
9/18

concat

=두 테이터 표를 합치고 싶을때 쓰는 함수

  1. 행을 기준으로 붙이기

pd.concat([df1,df2]) axis=0 은 행을 뜻하고 행을 기준으로 붙인다는 말이다. 디폴트 값이므로 굳이 적어주지 않아도 된다.

  1. 열을 기준으로 붙이기

pd.concat([df1,df2] , axis=1) axis=1은 열을 기준으로 붙인다는 말이다. 여기선 적어주어야 한다.

  1. 데이터 프레임의 순서가 다른데 붙여질까?

응~ 붙여진다~ 여기서 판다스의 힘이(인덱스와 열이라는 라벨링을 함) 나온다는겨

  1. 두 표의 겹치는 부분만 합치고 싶다, 두표의 열을 모두 합치고 싶다

    pd.concat([df1,df2], join="inner")


pd.concat([df1,df2], join="outer")

오늘의 목표

  1. 행방향, 열방향으로 두 표를 연결해보기 (axis)
  2. 컬럼 순서가 다른 표를 연결해보기
  3. inner join, outer join 이해하기

1. 판다스 가져오기

2. 행과 열을 기준으로 데이터 붙이기

  • 행을 기준으로 붙이기

  • 열을 기준으로 붙이기

* 열을 기준으로 붙일 때 발생할 수 있는 에러


해당 에러는 두 데이터프레임이 인덱스 번호가 정렬되어 있지 않기 때문임. concat 시키려는 데이터 프레임 모두 re_index()시켜 준 후 concat 해야함

df1.reset_index(drop=True, inplace=True)
df2.reset_index(drop=True, inplace=True)

3. 순서가 다른 데이터 붙이기

4. 조인 사용하기

  • inner join= 교집합

  • outer join= 합집합, 디폴트 값이라 안적어줘도 됨

+) 국어, 수학, 영어 과학만 뽑고 싶은 상황

reindex 사용해서 컬럼의 순서를 뒤짚어버린다.

profile
질문 없는 성장은 없다. 3년차 데이터 분석가

0개의 댓글