: 특정 웹 사이트의 html을 긁어 오는 것
💡 언제 사용되는지?
링크를 공유하면 밑에 자동으로 사이트 소개와 이미지가 미리보기로 가지고 올 때유저가 게시글을 작성하고 등록을 클릭하면, 백엔드 api로 글의 내용을 보내준다.
이때, 글의 내용에 http나 https가 포함된 url이 있다면, 그 사이트로 접속해서 og(open graph) 가 있는 내용을 긁어와서 저장한다.
cheerio를 사용한다.
: 스크래핑을 꾸준히 하는 것(정기적으로 가져옴)
💡 언제 사용되는지?
특정 사이트의 가격이나 그 외 정보 등을 꾸준히 가져올 때 사용된다.
위법사례가 있기 때문에 조심해야한다(다른 사이트의 데이터를 크롤링해와서 경제적인 이득을 봤을 때)
- 여기어때/야놀자 크롤링 위법 사례 : https://biz.chosun.com/topics/law_firm/2021/09/29/OOBWHWT5ZBF7DESIRKNPYIODLA/
- 사람인/잡코리아 크롤링 위법 사례 : https://brunch.co.kr/@lawmission/113
puppeteer를 사용