왭에 있는 특정 정보를 추출하는 기술
원하는 정보를 추출하기 위해 봇이 특정 사이트에 콘텐츠를 다운로드하기 위한 HTTP GET 요청을 보냄
사이트가 이에 응답하면 HTML 문서를 분석하여 특정 패턴의 데이터를 추출
정확한 정보를 요구할 떄 쓰이는 스크래핑 기술
프로그램으로 왭을 정기적으로 돌며 정보를 추출하는 기술
규칙에 따라 자동으로 왭 문서를 탐색하는 프로그램
페이지의 내용과 링크의 복사본을 생성하여 다운로드하고 요약본 생성
심층 분석과 실시간 정보 제공에 유용
참조