Python
웹스크래핑
Requests
import requests # requests 라이브러리 설치 필요 r = requests.get('url') rjson = r.json()
bs4
import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} data = requests.get('url',headers=headers) soup = BeautifulSoup(data.text, 'html.parser') xx = soup.select(태그명) xx = soup.select(".클래스명") xx = soup.select("아이디명") xx = soup.select("상위태그명 > 하위태그명 > 하위태그명") xx = soup.select("상위태그명.클래스명 > 하위태그명.클래스명") xx = soup.select("태그명[속성="값"]") for x in xx: a = x.select_one("mm > mm")
- *Chrome 개발자도구 (우클릭 -> Copy -> Copy selector)
DB (pymongo)
from pymongo import MongoClient client = MongoClient('localhost', 27017) db = client.db명 # 저장 db.컬렉션.insert_one({dict}) # 한 개 찾기 a = db.aa.find_one({"key":"value"}) # 여러개 찾기 - (_id 값은 제외하고 출력) aa = list(db.컬렉션.find({"key":"value"},{'_id':False})) # 바꾸기 db.컬렉션.update_one({"key":"value"},{'$set':{"key":"value"}}) # 지우기 db.컬렉션.delete_one({"key":"value"})