크롤링(스크랩핑) 한다
= 인터넷에 있는 데이터를 내 컴퓨터로 끌고온다.
파이썬은 자료형의 리스트를 쓴다는 것을 가정하고 만들었다.
그래서 반복문 for문 과 세트로 많이 쓰인다.
for user in all_users: print(user)
해석)
all_users 라는 리스트 안의 각 항목인 user를 모두 불러와라.
# 저장 - 예시
doc = {'name':'bobby','age':21}
db.users.insert_one(doc)
# 한 개 찾기 - 예시
user = db.users.find_one({'name':'bobby'})
# 여러개 찾기 - 예시 ( _id 값은 제외하고 출력)
all_users = list(db.users.find({},{'_id':False}))
# 바꾸기 - 예시
db.users.update_one({'name':'bobby'},{'$set':{'age':19}})
# 지우기 - 예시
db.users.delete_one({'name':'bobby'})
1)
1) 크롤링해서 가져온 정보에서 줄바꿈, 공백, 지우고 싶은 문자가 있을 때 대처법!
줄바꿈은 : .replace("\n", "")
공백은 : .replace(" ", "")
특정 문자 삭제 : .replace("특정문자", "")
을 추가해주면 된다.
.
예를 들어 음악리스트를 받았는데 19금 버튼 때문에 줄바꿈과, 앞공백이 생긴 상황일 때! 줄바꿈, 공백, 19금이라는 문자를 지워주고 싶다면,
if "19금" in title: title = title.replace("\\n", ""); title = title.replace(" ", ""); title = title.replace("19금", "");
위의 코드를 삽입해주면 된다.
파이썬에서 '실행' 단축키 : ctrl + shift + R