DataFrame 안에 있는 문자열이 특정 기호를 기준으로 나열된 규칙을 가질 때, 기호를 구분자로 분리하여 여러 개의 칼럼으로 만드는 방법을 알아봅니다.
Pandas의 str.split()
함수를 사용하여 각 문자열을 분할하고, expand=True
옵션을 사용하여 분할된 결과를 여러 개의 칼럼으로 변환할 수 있습니다.
예를 들어, 다음과 같은 DataFrame이 있다고 가정해봅시다.
import pandas as pd
df = pd.DataFrame({'name': ['Alice,Bob', 'Charlie,David', 'Eve,Frank']})
print(df)
위 코드는 다음과 같은 결과를 출력합니다.
name
0 Alice,Bob
1 Charlie,David
2 Eve,Frank
이제 ,
를 구분자로 사용하여 name 칼럼을 분할하고, 분할된 결과를 first_name
과 last_name
두 개의 칼럼으로 변환해보겠습니다.
df[['first_name', 'last_name']] = df['name'].str.split(',', expand=True)
print(df)
그럼 다음과 같은 결과를 출력합니다.
name first_name last_name
0 Alice,Bob Alice Bob
1 Charlie,David Charlie David
2 Eve,Frank Eve Frank
df['name'].str.split(',', expand=True)
name
칼럼의 각 문자열을 ,
로 분할하고, 그 결과를 새로운 DataFrame으로 반환합니다. expand=True
옵션을 사용하면 분할된 결과가 여러 개의 칼럼으로 구성된 DataFrame으로 반환되며, 이 DataFrame을 기존의 DataFrame(df
)과 연결하여 새로운 칼럼(first_name
, last_name
)을 만들게 됩니다.