[Python] re.sub()에서 여러 문자를 대체하기

Dahyun Song·2022년 1월 3일
0

크롤링을 하고 워드클라우드에 불필요한 문자가 포함되는것을 방지하기 위해 re.sub를 사용하였다.

content=''
for item in data:
    if 'content' in item.keys() :
#         re.sub()에서 여러 문자를 바꾸려면 |를 사용해 or로 구분해줘야함...
        content = content+ re.sub('위해',' ', item['content'] )+''

그런데 하나의 문자를 변경하는것은 알겠으니 한번에 여러개의 문자를 변경하는 방법을 찾기가 어려웠다.

또 열심히 구글링해 본 결과...

content=''
for item in data:
    if 'content' in item.keys() :
#         re.sub()에서 여러 문자를 바꾸려면 |를 사용해 or로 구분해줘야함...
        content = content+ re.sub('경찰|부산|혐의|지난|발생|사업|사건|위해',' ', item['content'] )+''

이런식으로 바꾸고 싶은 문자 뒤에 | 기호를 적어주면 되는것이었다. or의 개념인것 같다!

profile
안되면 될때까지!!

0개의 댓글

관련 채용 정보