bs4 사용법

ssm·2023년 8월 28일
0

본 내용은 빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술 강의를 들으며 실습하는 과정을 기록했습니다.

from bs4 import BeautifulSoup
import re

html = """
<ul>
    <li><a href="hoge.html">hoge</li>
    <li><a href="https://example.com/fuga">fuga*</li>
    <li><a href="https://example.com/foo">foo*</li>
    <li><a href="https://example.com/aaa">ada*</li>
</ul>
"""

soup = BeautifulSoup(html, 'html.parser')
href_reg = re.compile(r"^https://")
li = soup.find_all(href=href_reg)

for e in li:
    print(e.attrs['href'])
    print(e.string)

(수정중)

profile
내 뇌의 외장하드

0개의 댓글