DataFrame 안에 있는 문자열이 특정 기호를 기준으로 나열된 규칙을 가질 때, 기호를 구분자로 분리하여 여러 개의 칼럼으로 만드는 방법을 알아봅니다.
Pandas의 str.split() 함수를 사용하여 각 문자열을 분할하고, expand=True 옵션을 사용하여 분할된 결과를 여러 개의 칼럼으로 변환할 수 있습니다.
예를 들어, 다음과 같은 DataFrame이 있다고 가정해봅시다.
import pandas as pd
df = pd.DataFrame({'name': ['Alice,Bob', 'Charlie,David', 'Eve,Frank']})
print(df)
위 코드는 다음과 같은 결과를 출력합니다.
name
0 Alice,Bob
1 Charlie,David
2 Eve,Frank
이제 ,를 구분자로 사용하여 name 칼럼을 분할하고, 분할된 결과를 first_name과 last_name 두 개의 칼럼으로 변환해보겠습니다.
df[['first_name', 'last_name']] = df['name'].str.split(',', expand=True)
print(df)
그럼 다음과 같은 결과를 출력합니다.
name first_name last_name
0 Alice,Bob Alice Bob
1 Charlie,David Charlie David
2 Eve,Frank Eve Frank

df['name'].str.split(',', expand=True)
name 칼럼의 각 문자열을 ,로 분할하고, 그 결과를 새로운 DataFrame으로 반환합니다. expand=True 옵션을 사용하면 분할된 결과가 여러 개의 칼럼으로 구성된 DataFrame으로 반환되며, 이 DataFrame을 기존의 DataFrame(df)과 연결하여 새로운 칼럼(first_name, last_name)을 만들게 됩니다.