- Web scraping with BeautifulSoup
Beautiful Soup is a Python library for pulling data out of HTML and XML files.- Not-only SQL MongoDB with pymongo
MongoDB is a document database with the scalability and flexibility.
from pymongo import MongoClient
client = MongoClient('connection string')
db = client.DB이름
MongoClient
find()
사용할 때 잘 모르고 조건문을 한줄 더 적었는데, find 메서드에서 조건 설정이 가능하더라.
"""
처음에 시도한 것
if(리스트원소['key']==value):
"""
리스트이름 = list(DB이름.컬렉션이름.find({key:value},{'_id': False}))
메서드에 마우스 올리면 친절하게 설명까지 나온다.
몽고에서는 메서드 이름이
find
였고, 수프에서는 메서드 이름이select
이다.
지니 뮤직 scraping 숙제에서 강사님의 Best Practice는...
select
한 결과를 리스트에 넣고 select_one
으로 각 원소의 value에 접근나는 select_one
을 생각 못하고 select
를 여러번 한 다음 원소[index]
로 접근해버림.
"""
변수1 = soup.select(...)
변수2 = soup.select(...)
변수3 = soup.select(...)
for i in range(50):
변수1[i], 변수2[i], 변수3[i]
"""
#Best Practice
for 원소 in 셀렉트_리스트:
변수1 = 원소.select_one(...)
변수2 = ...
월요일 입학시험 전까지 4강 5강도 얼렁 듣자