문자열 다루기

Tino-Kim·2022년 1월 2일

beginner colaboratory python

🥴 문자열 다루기

데이터 분석 시에는 문자열도 많이 나오기 때문에 잘 알아두어야 한다.

텍스트 분석

크롤링 (웹사이트 내용 긁어오기)

엑셀 파일 다루기 등등..

📌 문자열의 길이를 나타내는 len( )

공백도 길이에 포함이 된다.
a = 'banana pen'
len(a)
# 10이다. 공백이 포함되었기 때문이다.

📌 문장 쪼개기인 split( )

변수.split('쪼개는 기준')
괄호 안에는 쪼개는 기준을 적어주고, sep과 같이 잘 쓰인다.

📌 대문자와 소문자로 만들어 주는 upper( )와 lower( )

lower
소문자로 만들어 준다.

upper
대문자로 만들어 준다.

데이터 분석할 때 대문자인 이름이나 소문자인 이름이나 모두 동일한 사람이다. 비교 연산자를 이용할 때, lower를 이용해서 문자열을 비교해준다.

하지만, 한글에는 대소문자가 없다.

📌 무엇으로 시작하고 끝나는지 보여주는 startswith( )와 endswith( )

startswith
괄호 안에 있는 것으로 시작되는가?

endswith
괄호 안에 있는 것으로 끝나는가?

파일을 찾을 때 유용하다.
a = '01-sample.png'
b = '02-sample.jpg'
c = '03-sample.pdf'

📌 바꿔주는 replace( )

변수.replace(바꾸고자 하는 것, 어떻게 바꿀 것인지 결과 적어주기)
하지만, 새로운 변수로 다시 할당해주지 않으면 원상복귀된다. 유지하고 싶으면 새로운 변수에 할당해주자.
a='01-sample.png'
a.replace('.png', '.jpg')
a
# '01-sample.png'
new_a = a.replace('.png', '.jpg')
new_a
# '01-sample.jpg'

📌 공백을 제거하는 strip( )

앞과 뒤 공백을 모두 제거해준다. 문자열에서는 공백이 있으면 같더라도 같다고 인식하지를 못 한다. 그러니까, 반드시 제거해준 후에 비교해주기.

a = '    01-sample.png                '
b = '01-sample.png'

a == b
# False
a.strip() == b
# True

😀 마무리...

💛 문자열에서 자주 다루는 메소드 모음 💛

len

split

lower

upper

startswith

endswith

replace

strip

잘 기억해두기~!

Tino-Kim

알고리즘과 데이터 과학과 웹 개발을 공부하는 대학생

이전 포스트

List Comprehension

다음 포스트

문자열 다루기

🥴 문자열 다루기

📌 문자열의 길이를 나타내는 len( )

📌 문장 쪼개기인 split( )

📌 대문자와 소문자로 만들어 주는 upper( )와 lower( )

📌 무엇으로 시작하고 끝나는지 보여주는 startswith( )와 endswith( )

📌 바꿔주는 replace( )

📌 공백을 제거하는 strip( )

😀 마무리...

List Comprehension

패키지와 모듈 그리고 import

0개의 댓글