이 글은 https://www.youtube.com/watch?v=yQ20jZwDjTE를 듣고 공부한 내용을 정리한 글입니다. 스크래핑 - 필요한 부분만 가져오는 것 크롤링 - 허용하는 범위 내의 데이터를 마구잡이로 가져오는 것 웹은 크게 세가지로 구성: html,
시작 전 beautifulsoup4 와 lxml을 pip install 키워드를 이용하여 설치하여야 한다. lxml은 xml을 해석하는 프로그램 즉, 파서이다. 실행 결과 실재 네이버 웹툰 페이지에서 관리자 도구로 들어갔을 때 볼수 있는 title태그 위의 코드