🔗수업내용 : 테킷 AI 스쿨 기초다지기
아래 게시글은 멋쟁이 사자처럼 ai school 내용에서 정리해온 내용입니다.
뒤죽박죽~!
웹페이지의 데이터를 모아주는 소프트웨어
크롤러를 사용해 웹페이지의 데이터를 추출해내는 행위
pip install requests
import requests
불러오기response = requests.get(url)
서버에 요청받기
🔗https://requests.readthedocs.io/en/latest/api/#requests.Response
시간나면 모듈 함수 이용해보기
from bs4 import BeautifulSoup
bs4.BeautifulSoup
으로 받아짐BeautifulSoup(데이터, 파싱방법)
BeautifulSoup.title
: url의 제목string
: 제목의 내용을 불러옴BeautifulSoup.span
: url에 있는 span 태그 상단 하나 불러오기soup.findAll('span')
: 모든 span태그 불러오기findAll
함수를 이용하여 랭킹 html의 소스구조 공통점을 찾아 그 랭킹만 찾아서 result 값에 받기headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
response = requests.get(url,headers=headers)