웹 페이지로부터 데이터를 추출하는 행위
-> 크롤러(crawler): 크롤링하는 소프트웨어
HTML(HyperText Markup Language)
웹사이트를 구성하는 마크업 언어
예시)
<!DOCTYPE html>
<html>
<head>
<title> HTML 문서 </title>
</head>
<body>
<h1> 이것은 HTML 문서입니다! </h1>
</body>
</html>
어떤 특정 태그들에 그룹이나 번호를 주는 기능
-> 선택자의 개념을 이용해서 크롤링을 보다 용이하게 할 수 있다!