[파이썬 판다스] 데이터 병합(merge)

이현지·2024년 6월 25일

머지 정렬

파이썬

목록 보기

13/21

데이터 병합 개요

단일 열 정렬

data.sort_values(by='SALARY', ascending=False)

복합 정렬

인덱스 리셋

변수명.reset_index(drop = True)

복합 열을 별도로 저장하고, 인덱스 리셋

temp = data.sort_values(by=['JobSatisfaction', 'MonthlyaIncome'], ascending=[True, False])

temp.reset_index(drop = True)

Colored by Color Scripter

판다스 불러오기

import pandas as pd

key를 기준으로 열과 열을 병합하기

데이터프레임 만들기 & 조회하기

left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],

'A': ['A0', 'A1', 'A2', 'A3'],

'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],

'C': ['C0', 'C1', 'C2', 'C3'],

'D': ['D0', 'D1', 'D2', 'D3']})

라이트 데이터 조회

right

데이터 병합

result = pd.merge(left, right, on='key')

데이터 조회

result

이 케이스의 경우 완벽하게 떨어지는 경우라서 아래와 같이 보인다.

머지 메소드

다른 케이스의 데이터 정렬

left = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'],

'key2': ['K0', 'K1', 'K0', 'K1'],

'A': ['A0', 'A1', 'A2', 'A3'],

'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],

'key2': ['K0', 'K0', 'K0', 'K0'],

'C': ['C0', 'C1', 'C2', 'C3'],

'D': ['D0', 'D1', 'D2', 'D3']})

머지

result = pd.merge(left, right, on=['key1', 'key2'])

result

Colored by Color Scripter

결과

키값이 맞는 것만 보임

left 데이터프레임 기본 > 복수개 key 기준 열과 열 병합하기

result_left = pd.merge(left, right, how='left', on=['key1', 'key2'])

result_left

Colored by Color Scripter

핑크색 부분을 보면 left 기준으로 병합이 된 것을 알 수 있다.

right 데이터프레임 기본 > 복수개 key 기준 열과 열 병합하기

result_right = pd.merge(left, right, how='right', on=['key1', 'key2'])

result_right

Colored by Color Scripter

right 기준으로 병합된 것을 확인 할 수 있다.

outer 방식 > 복수개 key 기준 열과 열 병합하기

result_outer = pd.merge(left, right, how='outer', on=['key1', 'key2'])

result_outer

Colored by Color Scripter

inner 방식 > 복수개 key 기준 열과 열 병합하기

result_inner = pd.merge(left, right, how='inner', on=['key1', 'key2'])

result_inner

Colored by Color Scripter

이현지

관심분야: 추천시스템, 자연어처리, 머신러닝, 딥러닝

이전 포스트

[파이썬 판다스] 특정 기준으로 조회/집계

다음 포스트

[파이썬 판다스] 데이터 병합(merge)

파이썬

데이터 병합 개요

단일 열 정렬

복합 정렬

key를 기준으로 열과 열을 병합하기

다른 케이스의 데이터 정렬

left 데이터프레임 기본 > 복수개 key 기준 열과 열 병합하기

right 데이터프레임 기본 > 복수개 key 기준 열과 열 병합하기

outer 방식 > 복수개 key 기준 열과 열 병합하기

inner 방식 > 복수개 key 기준 열과 열 병합하기

[파이썬 판다스] 특정 기준으로 조회/집계

[파이썬 맷플롯립] 바 차트와 히스토그램

0개의 댓글