웹 크롤링(Crawling)과 웹 스크래핑(Scraping)

majungha·2023년 3월 22일

Crawling scraping 공부 메모

메모

목록 보기

13/57

오늘의 공부 👍

2주차 시간에 배우는 웹 크롤링(Crawling)과 웹 스크래핑(Scraping)을 예습하고 싶어서 정리 해보겠습니다.

📝 웹 크롤링(Crawling)과 웹 스크래핑(Scraping)

고객들이 원하는 정보만을 골라 보여주는 기술

📝 웹 크롤링(Crawling)

Web상의 정보들을 탐색하고 수집하는 작업을 의미합니다.
규칙에 따라 자동으로 웹 문서를 탐색하는 컴퓨터 프로그램
검색 포털(네이버, 구글)에 키워드를 입력하면 해당 포털의 URL을 지닌 페이지 뿐만 아니라 외부 사이트도 본문의 요약본이 나오는 것을 볼 수 있습니다.
이러한 요약본을 만드는 것이 웹 크롤러가 하는 일입니다.
출처: https://blog.codef.io/crawling_vs_scraping/
요약

방대한 데이터를 수집하므로, 변화하는 데이터 파악에 유용하다. (내가 찾는 키워드와 연관된 링크)

📝 웹 스크래핑(Scraping)

특정 웹 사이트나 페이지에서 필요한 데이터를 자동으로 추출해 내는 것을 의미합니다.
자동으로 수집된 특정 정보가 필요한 분야에서 다양하게 활용되고 있습니다.(금융, 주식, 전자상거래 시장 등)
가격 변동 이슈를 빠르게 파악하기 위해 스크래핑 기술을 활용하기도 합니다.
이러한 데이터를 원하는 대로 사용할 수 있도록 데이터베이스에 저장 해주는 것이 스크래퍼 봇이 하는 일입니다.
출처: https://blog.codef.io/crawling_vs_scraping/
요약

특정 사이트나 페이지에 대한 데이터를 찾으므로, 정확한 정보를 요구할 때 유용하다. ( 주식 정보, 뉴스 등)

📝 웹 크롤링 vs 웹 스크래핑

웹 크롤링은 계속해서 탐색을 이어나가지만,
웹 스크래핑은 특정 웹 사이트에 특정 데이터를 추적하는 차이가 있습니다.

참고: https://blog.codef.io/crawling_vs_scraping/
참고: https://brightdata.com/blog/leadership/web-crawling-vs-web-scraping
참고: https://www.cloudflare.com/ko-kr/learning/bots/what-is-data-scraping/
참고: https://www.cloudflare.com/ko-kr/learning/bots/what-is-a-web-crawler/

majungha

개발자 블로그 / 항상 겸손한 자세로 배우면서 성장하자 할 수 있다!

웹 크롤링(Crawling)과 웹 스크래핑(Scraping)

메모

오늘의 공부 👍

📝 웹 크롤링(Crawling)과 웹 스크래핑(Scraping)

📝 웹 크롤링(Crawling)

📝 웹 스크래핑(Scraping)

📝 웹 크롤링 vs 웹 스크래핑

Docker

Callback / Promise

0개의 댓글