웹크롤링 3 - 크롤링을 위한 HTML 개념

우수민·2022년 12월 31일
0

강의 자료

목록 보기
18/18
post-thumbnail

시작전 알아야할 정보

- 웹 크롤링을 하기 위해서는 HTML에 대한 어느정도의 지식이 필요하다. 
- 왜냐하면 웹은 기본적으로 HTML로 만들어져 있기 때문이다. 
- 하지만, 크롤링이 목적이라면 HTML을 완전히 이해할 필요는 없다.

HTML이란?

<출처 : 위키 백과>

  • 하이퍼 텍스트 마크업 언어(Hyper Text Markup Language, HTML)는 웹 페이지 표시를 위해 개발된 지배적인 마크업 언어다.
  • 아래의 이미지는 웹 페이지에서 F12를 누르게 될 경우 발생하는 화면 예시 입니다.

  • 또한, HTML은 제목, 단락, 목록 등과 같은 본문을 위한 구조적 의미를 나타내는 것뿐만 아니라 링크, 인용과 그 밖의 항목으로 구조적 문서를 만들 수 있는 방법을 제공한다. 그안의 꺾쇠 괄호에 둘러싸인 "태그"로 되어있는 HTML 요소 형태로 작성한다.

  • HTML은 웹 브라우저와 같은 HTML 처리 장치의 행동에 영향을 주는 자바스크립트, 본문과 그 밖의 항목의 외관과 배치를 정의하는 CSS 같은 스크립트를 포함하거나 불러올 수 있다.

  • 아래 이미지를 간단하게 설명하면 HTML은 구조를 잡아주고 CSS는 꾸며주고 JS(자바 스크립트)는 기능을 구현해준다고 보면 쉽습니다.

HTML 구조

HTML 용어 및 규칙

profile
데이터 분석하고 있습니다

0개의 댓글