[python] 웹 크롤링 - requests 라이브러리

Gen·2022년 3월 27일
0

python

목록 보기
2/2

수업에서 배운 웹크롤링 복습하다가 뭔 소린지 몰라서 찾아본 requests 라이브러리!

복습은 역시 당일에 해야되는 것이다.

네이버에 http 요청하는 법

우선 requests library를 이용하기 위해서는 import를 입력한다.

만약 네이버 메인 페이지를 가져오고 싶다고 한다면,

#requests 라이브러리 불러오기
import requests

# 네이버 url 불러오기
url = 'https://naver.com'

# requsts로 url에 정보요청
rep = requests.get(url)

# 요청이 제대로 됐는지 확인하기
print(rep.status_code)

'rep'는 보통 response를 줄여서 많이들 사용하는 것 같길래 나도 따라써봤다.

print(rep.status_code)

요청이 제대로 작동했다면 위 결과로 200이라는 값이 나온다.

요청을 받아와서 무언가를 하고 싶은데 제대로 요청됐는지 확인하고 싶을 때 if조건문을 사용한다.

if response.status_code == 200: 
	print("정상") 
else: 
	print("비정상 [코드 : {}]".format(response.status_code))

이렇게 작성해도 되고

if response.status_code == requests.codes.ok: 
	print("정상") 
else: 
	print("비정상 [코드 : {}]".format(response.status_code))

코드 참고 : https://hi-guten-tag.tistory.com/m/5

200이라는 숫자를 넣지 않고 requests.codes.ok 넣어도 된다.
-> 난 이게 이해가 안되서 구글링해본 것.

현재의 나로서는 200이 글자수가 더 적고 쓰기 간편한데 왜 굳이 requests.codes.ok <- 이렇게까지 길게 적어야되지 싶지만, 글로 적어주는게 아무래도 모든 사람이 이해하기 좋으니까 그런게 아닐까 싶다. 아님말고

0개의 댓글