띵동코딩 2주차 개발 일지

Chang·2022년 7월 15일
0
post-thumbnail

스크래핑이라니..

이번주는 스크래핑에 대해서 배웠다. for문이랑 if문 정도 배운 것 같은데 벌써 스크래핑이라니..재밌잖아!라는 생각이 들었다. 작성했던 코드는 이런 것들이었는데 생각보다 재밌더라.

import requests
from bs4 import BeautifulSoup

def get_news(keyword):
  headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
  data = requests.get(f'https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}',headers=headers)

  soup = BeautifulSoup(data.text, 'html.parser')

  lis = soup.select('#main_pack > section > div > div.group_news > ul > li')

  for li in lis:
    a = li.select_one('a.news_tit')
    media = li.select_one('a.info.press').text
    media = media.replace('언론사 선정','')
    print(a.text, a['href'], media)

이번주에 해보면서 재밌었던 것은 파이썬 변수들의 선언 구조 같은 것이었는데..
C++의 구조와 좀 다른 것 같아서(오히려 php랑 비슷한 느낌) 더 재밌던 것 같다.
SQL 공부를 잠깐 멈췄는데, 다시 시작해도 좋을듯하다.

스크래핑은 몇가지 더 연습해봐야겠단 생각도 들었다.

profile
Agile & Product

0개의 댓글