스타벅스 크롤링을 만 하루 넘게 열심히 했는데, 저장해두고 나니 이렇게 줄바꿈이 들어가서 데이터가 안예쁘게 깨진다 .
html 에 <br>
이 포함되어 있어서 그렇다.
.text 로 해서 크롤링 했는데, 거기서 <br>
을 빼주려면 어떻게 해야할까 ㅠ
블로그를 찾아보다가 이런 걸 봤다.
(출처 : https://crazyj.tistory.com/80)
그래서 직접 적용해 보았다.
결과:
1) 텍스트로 추출하면 str type이다.
2) str type 에 replace method 를 적용하면 된다.
결론 : 줄바꿈이 생기는 str type 추출물(?) 끝에
.replace('\n','')
붙여주기!