pip install beautifulSoup4
import requests
from bs4 import BeautifulSoup
res = request.get("http://example.com")
soup = BeautifulSoup(res.text,"html.parser")
# 보기 편한 출력은 prettify를 사용한다.
# print(soup.prettify())
요소를 하나 찾고 싶은 경우 find, 여러개의 경우 find_all을 사용한다.
soup.find("h1")
results=soup.find_all("p")
# id를 이용해 요소 가져오기
soup.find("div",id = "results")
# class를 이용해 요소를 가져오기
result = soup.find("div",class = "page-header")
# text 값을 출력
# result.h1.text.strip()
페이지가 많은 경우 url을 통해 page를 변경 가능하다. 따라서 request.get을 반복적으로 수행하면서 값을 가져오면 된다.
for i in range(1,10):
res = request.get(f"http://example.com/page={i}")
: 시간이 조금 남는 경우에 알고리즘 공부를 같이 하려한다.