[Python] 파이썬 학습일지 13

이소티·2023년 7월 7일

python

목록 보기
25/33

BeaufifulSoup for Web Data



  • print( ) : html 출력을 보기 좋게 만들어 줌

  • prettify( ) : 들여쓰기 출력



page = open("../data/03. zerobase.html", "r").read()
soup = BeautifulSoup(page, "html.parser")
print(soup.prettify())





  • 태그 확인


soup.head
soup.body



  • 특정 태그 확인 (p)



soup.p
soup.find("p")



  • class_
soup.find("p", class_="inner-text first-item")




# 이렇게 작성해도 됨

soup.find("p", {"class" : "inner-text first-item"})



  • strip( ) : 공백 줄여주기
soup.find("p", {"class" : "inner-text first-item"}).text.strip()



  • 다중 조건
soup.find("p",{"class" : "inner-text first-item", "id" : "first"})



  • find_all( ) : 여러개의 태그 모두 반환
soup.find_all("p")



p 태그 리스트에서 텍스트 속성만 출력

for each_tag in soup.find_all("p"):
    print("=" * 50)
    print(each_tag.text)

profile
데이터 관련 학습 일지

0개의 댓글