웹 크롤링과 웹 스크래핑

s2ul3·2022년 9월 26일
0

❓둘 차이는 뭘까?❓
웹 스크래핑

  • 웹 페이지들로부터 우리가 원하는 정보를 추출
  • 특정한 목적으로 특정 웹 페이지에서 데이터를 추출하는 것 (데이터 추출)
    ex) 날씨 데이터 가져오기, 주식 데이터 가져오기

웹 크롤링

  • 크롤러를 이용해서 웹 페이지의 정보를 인덱싱
  • URL을 타고다니며 반복적으로 데이터를 가져오는 과정 (데이터 색인)
    ex) 검색 엔진의 웹 크롤러

웹 브라우징 (웹사이트를 타고타고 돌아다니는 것)은 사람이 아닌, 로봇이 진행할 수 있다.
robots.txt
user-agent : 요청을 보낸 사람
disallow : 접근 거부
allow : 접근 허용

profile
statistics & computer science

0개의 댓글