크롤링을 하고 워드클라우드에 불필요한 문자가 포함되는것을 방지하기 위해 re.sub를 사용하였다.
content=''
for item in data:
if 'content' in item.keys() :
# re.sub()에서 여러 문자를 바꾸려면 |를 사용해 or로 구분해줘야함...
content = content+ re.sub('위해',' ', item['content'] )+''
그런데 하나의 문자를 변경하는것은 알겠으니 한번에 여러개의 문자를 변경하는 방법을 찾기가 어려웠다.
또 열심히 구글링해 본 결과...
content=''
for item in data:
if 'content' in item.keys() :
# re.sub()에서 여러 문자를 바꾸려면 |를 사용해 or로 구분해줘야함...
content = content+ re.sub('경찰|부산|혐의|지난|발생|사업|사건|위해',' ', item['content'] )+''
이런식으로 바꾸고 싶은 문자 뒤에 | 기호를 적어주면 되는것이었다. or의 개념인것 같다!