DataFrame 문자열을 구분자로 분리해 여러 칼럼으로 만드는 방법

nomaday·2023년 2월 19일
1

Note

목록 보기
3/5

DataFrame 안에 있는 문자열이 특정 기호를 기준으로 나열된 규칙을 가질 때, 기호를 구분자로 분리하여 여러 개의 칼럼으로 만드는 방법을 알아봅니다.


Pandas의 str.split() 함수를 사용하여 각 문자열을 분할하고, expand=True 옵션을 사용하여 분할된 결과를 여러 개의 칼럼으로 변환할 수 있습니다.

예를 들어, 다음과 같은 DataFrame이 있다고 가정해봅시다.

import pandas as pd

df = pd.DataFrame({'name': ['Alice,Bob', 'Charlie,David', 'Eve,Frank']})
print(df)

위 코드는 다음과 같은 결과를 출력합니다.

           name
0     Alice,Bob
1  Charlie,David
2      Eve,Frank

이제 ,를 구분자로 사용하여 name 칼럼을 분할하고, 분할된 결과를 first_namelast_name 두 개의 칼럼으로 변환해보겠습니다.

df[['first_name', 'last_name']] = df['name'].str.split(',', expand=True)
print(df)

그럼 다음과 같은 결과를 출력합니다.

           name first_name last_name
0     Alice,Bob      Alice       Bob
1  Charlie,David    Charlie     David
2      Eve,Frank        Eve     Frank


df['name'].str.split(',', expand=True)

  • name 칼럼의 각 문자열을 ,로 분할하고, 그 결과를 새로운 DataFrame으로 반환합니다.
  • expand=True 옵션을 사용하면 분할된 결과가 여러 개의 칼럼으로 구성된 DataFrame으로 반환되며, 이 DataFrame을 기존의 DataFrame(df)과 연결하여 새로운 칼럼(first_name, last_name)을 만들게 됩니다.

0개의 댓글