[스파르타코딩] 지니뮤직 크롤링하기

장만옥·2021년 8월 5일
0

벌써 스파르타코딩 수업 3주차를 완료했다
남은 수업은 2주인데 이번에는 생각보다 과제 제출과 강의를 빨리 들어서 제법 시간이 많이 남는다
이것저것 설치할 게 많았고 설치하면서 제대로 안된 부분 때문에 꽤 마음이 조급했는데 예상보다 빠르게 수업을 끝낼 수 있어서 뿌듯하다~
이번 3주차는 파이썬 그리고 크롤링을 배웠다. 재밌다~
좀 어렵긴하지만 하루하루 30분! 모르는 부분 수업 다시 들으면서 코드 똑같이 따라서 써보면 좀 익숙해진다

3주차 과제가 나왔다
[지니뮤직 크롤링하기]

이건 생각보다 어렵지 않았고 코드가 생각보다 길거나 늘어지지 않았고 수업 때 했던 것들 다시 보면서 코드 긁어오다 보니 금방할 수 있었다!
참고로 나는 퇴근하고 샤워하고 1시간 정도 걸렸다
선생님 말로는 구글링을 생활화하자고 하시는데 나도 이 부분은 좀 생활화 해야할 것 같다!
모르면 구글링


3주차 들어야할 강의들
1) PYTHON
2) 크롤링
3) MONGODB

파이썬을 설치한다는 것의 의미는 번역팩을 설치한다고 생각하면 쉽다! 파이썬 문법을 컴퓨터가 알아먹을 수 있는 용어로 바꿔주는 것!

크롤링을 하기 위해서는 파이참 내에 파이썬을 설치하고
INTERPRETER에서 BS4 패키지를 설치해야한다
그럼, 크롤링의 기본 셋팅 코드는 이렇게 나온다
크롤링을 할때는 꼭 아래의 코드가 기본이다!

import requests
from bs4 import BeautifulSoup

# 타겟 URL을 읽어서 HTML를 받아오고,
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=pnt&date=20200303',headers=headers)

# HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
# soup이라는 변수에 "파싱 용이해진 html"이 담긴 상태가 됨
# 이제 코딩을 통해 필요한 부분을 추출하면 된다.
soup = BeautifulSoup(data.text, 'html.parser')

#############################
# (입맛에 맞게 코딩)
#############################

그럼 3주차 숙제인 지니뮤직 크롤링으로 가본다
지니뮤직 사이트 : https://www.genie.co.kr/chart/top200?ditc=D&ymd=20200403&hh=23&rtm=N&pg=1

숙제는 순위/곡 제목/가수 이렇게 스크리핑 하면 된다

이만 수업들으러 가야해서..조만간 다시 보완해야겠다..

profile
마케터 만옥이 개발일지

0개의 댓글