강의를 들으면서 웹스크랩핑이라는 분야에 대해 알게 되어 복습겸 작성합니다.
특정 원하는 정보만 가져오고 저장하는 기술
특정 구조를 분석해 구조하된 데이터를 가져오는 기술
크롤링
차이점
크롤링은 도서관을 만드는 행위
스크래핑은 특정 책의 필요한 문장만 찾아서 쓰는 행위
http통신
웹 스크래핑은 http통신을 모방해야한다
js가 실행되는 시점은 랜더링이 끝난 뒤에 시작된다
브라우저가 응답응ㄹ 받고 랜더링 후에 사용자에게 틀을 보여주고 난 뒤 js를 실행하며 이러한 이유로 html문서에 js를 추가할때는 scipt태그를 제일 하단에 위치했던 기억이 났으며 중간에 script를 넣으면 중간에 js를 실행할수도 있겠다는 생각이 들었음
정적 페이지와 동적페이지의 차이로는 js에 있었고
동적페이지의 특징은
동적 페이지는 한번에 전체 html과 알멩이(js)를 가져옴
single page application
multi page application
-user-agent에 따라 허락할 항목과 접근을 금지하는 항목 리스트