Ex06. 뉴스제목 수집

박산해·2025년 3월 26일

Ex06. 뉴스제목수집 (실습)

브라우저를 담당하는 라이브러리

from selenium import webdriver as wb

선택자를 구분할 때 사용하는 라이브러리

from selenium.webdriver.common.by import By

컴퓨터용 키보드 (엔터, del, end) 기능을 가진 키를 입력

from selenium.webdriver.common.keys import Keys

#1. 브라우저 실행 -> 네이버로 이동
driver = wb.Chrome()
driver.get("https://www.naver.com")

#2. 검색창에 산불 검색 -> 엔터입력
search = driver.find_element(By.ID,"query")
search.send_keys("산불")
search.send_keys(Keys.ENTER)

#3. 상단의 뉴스 탭 클릭
btc = driver.find_element(By.CSS_SELECTOR,"#lnb > div.lnb_group > div > div.lnb_nav_area._nav_area_root > div > div.api_flicking_wrap._conveyer_root > div:nth-child(1) > a")
btc.click()

#4. 페이지 맨 밑으로 3번 이동 -> time.sleep() 활용하기
import time
body = driver.find_element(By.TAG_NAME,"body")
for i in range(3) :
body.send_keys(Keys.END)
time.sleep(1)

#5. 뉴스 타이틀 수집 -> 선택자 복수개로 수정하기
title = driver.find_elements(By.CSS_SELECTOR,"div > div > div.news_contents > a.news_tit")

#6. 컨텐츠(글자)만 저장하는 리스트 제작
title_list = []
for i in range(len(title)) :
title_list.append(title[i].text)

print(len(title_list))
title_list

0개의 댓글