주기적으로 스크래핑을 여러번 하는 것을 말함
크롤링하고자 하는 사이트 url/robots.txt 확인
설치
yarn add puppeteer
코드 예시
import puppeteer from "puppeteer";
async function startCrawling() {
// 가상 브라우저를 변수에 저장
// 가상 브라우저를 통해 유저처럼 동작
// headless : true : 눈에 보이지 않게 가상 브라우저가 띄워지지 않음
// headless : false : 가상브라우저가 우리눈에 보임
const browser = await puppeteer.launch({ headless: false });
const page = await browser.newPage();
await page.setViewport({ width: 1280, height: 720 }); // 열릴 브라우저 크기 설정
await page.goto("https://www.goodchoice.kr/product/search/2"); // 해당 주소로 이동함
await page.waitForTimeout(1000); // 페이지 전부 로딩될때까지 기다림
const stage = await page.$eval(
"#poduct_list_area > li:nth-child(2) > a > div > div.name > div > span",
(el) => el.textContent
);
const location = await page.$eval(
"#poduct_list_area > li:nth-child(2) > a > div > div.name > p:nth-child(4)",
(el) => el.textContent
);
const price = await page.$eval(
"#poduct_list_area > li:nth-child(2) > a > div > div.price > p > b",
(el) => el.textContent
);
console.log(stage);
console.log(location.trim());
console.log(price);
}
startCrawling();