- 파이썬 기본적으로 제공하는 라이브러리가 아니므로 별도 설치 필요
- Anaconda는 BeautifulSoup 패키지가 Site-packages로 설치되어 있음
- 설치
- HTML 및 XML 파일의 내용을 읽을 때 다음 파서(Parser) 이용
- 파이썬이 내장하고 있는 파서 사용 가능
- 좀 더 성능이 좋은 파서를 추가로 설치하여 사용해도 됨
- HTML 문서를 파싱하고 bs4.BeautifulSoup 객체 생성
- <html>, <head> 태그와 <body> 태그는 제외하고 접근하려는 태그에 계층구조를 적용
- 태그명을. 연산자와 함께 사용
- HTML 문서의 내용을 파싱하여 BeautifulSoup 객체 생성
- bs4.element.Tag객체의 주요 속성과 메서드
- HTML 문서에 대한 파싱이 끝나고 생성된 트리구조 형식의 DOM 객체
- bs4.BeautifulSoup 객체의속성으로접근가능- 다음에 제시된 메서드로도 가능
- find( )는 find_all( )에 limit=1로 설정한 것과 동일하게 수행
- find_all( )에서 사용하는 아규먼트값을 find( )에서도 동일하게 사용 가능