2022.06.10 네이버증시

김오왼·2022년 6월 10일
2

Data-analysis

목록 보기
15/15


news_href <- c()
news_text <- c() #news_href안의 news_url만큼 반복



urls <- paste0("https://news.naver.com/main/list.naver?mode=LS2D&mid=shm&sid2=258&sid1=101&date=20220610&page=2")


for (url in urls) {
  get_url <- GET(url) 
  
  my_html <-  read_html(get_url)
  
  my_nodes <- html_nodes(my_html,"dt > a") 
  
  my_href <-html_attr(my_nodes,"href")
  
  news_href <- c(news_href,my_href)
  
  for (news_url in 1:10) { #벡터를 이용해 반복문을 실행한다. 각각원소의 개수만큼 반복문이
#진행되며 news_url이 차례로 이용된다.
    T.selector <- paste0("#main_content > div.list_body.newsflash_body > ul.type06_headline > li:nth-child(",news_url,") > dl > dt:nth-child(2) > a")
    my_nodes1 <-html_nodes(my_html,"#main_content > div.list_body.newsflash_body > ul.type06_headline") #<-headline만 뽑아오기
    news <- html_text(my_nodes1)
    news_text <- c(news_text,news)
  }

}  


df_new_href <- data.frame(news_href)
profile
전문 금융인을 목표로하는 김야옹야옹이

1개의 댓글

comment-user-thumbnail
2022년 6월 24일

멋있네요ㅎㅎ

답글 달기