벨로그에서 원하는 포스트를 검색하고 최신순으로 정렬된 결과를 보고 싶었습니다. 그러나 벨로그는 무한 스크롤 방식을 사용하여 검색 결과를 제공하기 때문에, 모든 결과를 가져오려면 스크롤을 끝까지 내려야 합니다. 벨로그에서 공식 API를 제공하지 않기 때문에, 직접 크롤링을 통해 이 기능을 구현하게 되었습니다.
웹 애플리케이션 프레임워크: Flask
웹 브라우저 자동화: selenium
과 webdriver_manager
selenium
은 웹 브라우저를 자동화하여 벨로그 페이지를 탐색하고, webdriver_manager
는 크롬 드라이버를 관리하는 데 사용했습니다.HTML 파싱: BeautifulSoup
BeautifulSoup
을 사용하여 가져온 웹 페이지의 HTML을 파싱하고, 필요한 데이터를 추출했습니다.비동기 처리: concurrent.futures
날짜 및 시간 처리: datetime
무한 스크롤 처리: selenium
selenium
의 자바스크립트 실행 기능을 사용하여 페이지의 끝까지 스크롤을 반복했습니다.가끔은 이렇게 다른 개발 (?) 같은 것들을 할 때 재밌다.
프론트엔드.. 언어들은.. 정말 하나하나 다 알아야하고 다 내것이어야만 하고
파이썬 외 나머지는 나의 개발 숨구멍,, 암튼간에. 재밌다 파이썬 ㅋㅋ
그리고 고맙다 챗GPT 넌 나의 단짝친구. 그리고 이제 정말 블로그마냥 써볼까한다. 아자아자 !