Scraping & Crawling

박선우·2023년 1월 17일
0

CS 스터디

목록 보기
21/53
post-thumbnail

🌼 Scraping & Crawling

  • 타 웹 페이지를 가져와 데이터를 추출하는 행위이다.

1️⃣ Scraping

  • 우리가 정한 특정 웹 페이지에서 데이터를 추출하는 것
  • 특정주제 스포츠 뉴스에 랭킹 1~5위인 데이터, 어떤 물품의 가격등 -> 원하는 데이터 추출

2️⃣ Crawling

  • URL을 탐색해 반복적으로 링크를 찾고 가져오는 과정
  • 크롤러 : 데이터를 수집하는 기능

3️⃣ Scraping & Crawling 차이점

ScrapingCrawling
어디서 정보를 가져올지 정하고 정보를 가져온다. (선결정 후추출)탐색후 정보를 가져옴(선탐색 후추출)
색인을 남김으로써 중복방지(web indexing)

출처

profile
코린이 열심히 배우자!

0개의 댓글