이번주는 스크래핑에 대해서 배웠다. for문이랑 if문 정도 배운 것 같은데 벌써 스크래핑이라니..재밌잖아!라는 생각이 들었다. 작성했던 코드는 이런 것들이었는데 생각보다 재밌더라.
import requests
from bs4 import BeautifulSoup
def get_news(keyword):
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(f'https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
lis = soup.select('#main_pack > section > div > div.group_news > ul > li')
for li in lis:
a = li.select_one('a.news_tit')
media = li.select_one('a.info.press').text
media = media.replace('언론사 선정','')
print(a.text, a['href'], media)
이번주에 해보면서 재밌었던 것은 파이썬 변수들의 선언 구조 같은 것이었는데..
C++의 구조와 좀 다른 것 같아서(오히려 php랑 비슷한 느낌) 더 재밌던 것 같다.
SQL 공부를 잠깐 멈췄는데, 다시 시작해도 좋을듯하다.
스크래핑은 몇가지 더 연습해봐야겠단 생각도 들었다.