웹페이지의 구조를 나타내기 위한 언어태그로 구성되어 있다.꺾쇠 괄호로 표시시작태그와 종료태그로 만들어짐태그는 속성명과 속성값이 있을 수 있다. ex)id -> 속성명title -> 속성값div : 구역 나누기a : 링크h1 : 제목p : 문단ul, li : 목록a 태그
내가 원하는 태그를 선택할 수 있게 해주는 beautifulsoup 라이브러리에 대해 알아봅시다. 우선 아래 명령어로 설치부터 해볼까요?\*\* 파싱 : 어떤 페이지(문서, html 등)에서 내가 원하는 데이터를 특정 패턴이나 순서로 추출해 가공하는 것\*\* span
https://en.wikipedia.org/wiki/CSScascading style sheet웹사이트의 디자인을 표시하기 위한 언어글자 색 변경, 폰트 크기, 가로 세로 길이 변경디자인을 변경할 HTML 태그를 선택하는 것 = 크롤링할 HTML 태그를 선
요즘 핫한 '코로나'👿 검색해볼까요? 1\. 내용 : 내용 굵은 글씨로 변경 2\. 태그 안쪽: 제목에 대한 내용 3\. href의 속성값 : 뉴스 원본 사이트 주소우리는 뉴스 기사 링크 및 제목 crawling를 하고 싶습니다. 따라서 제목에 해당하는 태
웹 링크로부터 html 문서를 추출하는 request 라이브러리의 한계를 극복하는 또 하나의 crawling library, Selenium에 대하여 알아봅시다.로그인이 필요한 사이트의 경우, 크롤링이 어려움동적으로(dynamic) HTML이 설계되어 있는 경우 ex)