NoSQL에서 Document Database를 지원하기 위해 데이터를 변환하는 프로그래밍 기법
웹 크롤러로 페이지의 정보를 얻고 섹션별로 데이터를 추출하는 것 이다. 이것들을 잘 정리해서 db에 저장할 수 있다.
크롤링도 스크래핑과 다르지 않다. 웹 페이지를 그대로 가져와서 데이터를 추출하는 것이다.
그렇다면 이 둘의 차이점은 뭘까? 크롤링은 웹 페이지의 링크를 타고 계속해서 탐색을 한다. 반면에 스크래핑은 데이터 추출을 원하는 대상이 명확하기 때문에 특정 사이트만을 추적한다는 차이점이 있다.
Docker compose volume