[TIL] 2020.09.10 Starbucks serise_Crawling 텍스트 줄바꿈 문제

dev.soo·2020년 9월 10일
0

modeling & crawling

목록 보기
2/3
post-thumbnail

스타벅스 크롤링을 만 하루 넘게 열심히 했는데, 저장해두고 나니 이렇게 줄바꿈이 들어가서 데이터가 안예쁘게 깨진다 .

html 에 <br> 이 포함되어 있어서 그렇다.

.text 로 해서 크롤링 했는데, 거기서 <br> 을 빼주려면 어떻게 해야할까 ㅠ

블로그를 찾아보다가 이런 걸 봤다.

(출처 : https://crazyj.tistory.com/80)

그래서 직접 적용해 보았다.

결과:
1) 텍스트로 추출하면 str type이다.
2) str type 에 replace method 를 적용하면 된다.

결론 : 줄바꿈이 생기는 str type 추출물(?) 끝에 .replace('\n','')붙여주기!

0개의 댓글