pandas에는 데이터들의 문자열을 다룰 수 있는 메소드들이 있습니다. 이 메소드들은 다음과 같습니다.
| 메소드 | 설명 |
|---|---|
.str.contains(문자열) | 문자열을 포함하고 있는지 유무 |
.str.replace(기존문자열, 대치문자열) | 문자열 대치 |
.str.split(문자열, expand=True/False, n=개수) | 특정 문자열을 기준으로 쪼개기 |
.str.lower() | 소문자로 바꾸기 |
.str.upper() | 대문자로 바꾸기 |
예시는 다음과 같습니다.
df2 = df.copy()
miss_mask = df2['Name'].str.contains("Miss")
df2.loc[miss_mask].head()
여기서 시리즈 내에 문자열에 하나하나 접근을 하기 위해 str을 사용합니다.
위 코드의 결과는 다음과 같습니다.
