뉴스 기사 크롤링 중, 원하는 기사 날짜가 아닐 경우에는 받지 않을려고 했습니다.
그래서 시도한 결과 이상한 점을 발견했는데요.
다르다면서, 눈으로 보기에는 완전히 같은 것처럼 보입니다.
이를 해결하기 위해 2가지를 확인해야 합니다.
1. 문자열의 길이는 같은지?
출력 결과 길이는 같으므로, 2번이 의심됩니다.
인코딩 결과가 다른지? (크롤링 중에 종종 발생합니다.)
저는 Visual Studio Code로 작업을 하고, UTF-8 로 인코딩합니다.
크롤링한 사이트에서 특수문자(공백,특수문자들 등등)의 인코딩 형식이 다를 수 있습니다.
date_string 과 ' - Jun 16, 2022' 의 인코딩 결과를 UTF-8형식으로 비교해보겠습니다.
인코딩 결과가 다른 것을 알게 됐습니다. 'Jun' 이후부터는 동일하므로, ' - ' 부분 이후부터를 슬라이싱으로 받아서 비교해보겠습니다.
same이 떴네요 해결했습니다~