보통 API -> Pandas Data Frame으로 변환해서 사용할 수 있음.
없다면 web scraping 이나 web crolling 을 해야함.
web scraping 은 내가 request한 webpage를 잘 parsing 해서 필요한 데이터를 추출해내는 일!
-> Yes24 스크래핑
request.get()
으로 검색 결과 페이지 html을 가져올 수 있음.request.get()
으로 도서 상세 페이지 html 가져오기html에서 특정 정보를 추출하는 것은 생각보다 까다롭다.
=> python 의 BeautifulSoup library 를 써보자
find()
메서드를 사용하면 특정 attribute 값을 가진 element 를 찾을 수 있다. find_all()
사용하면 해당 되는 모든 element 를 list 로 받는다.tr_find('td').get_text() == "쪽수"
조건문으로 원하는 데이터를 찾는다.