23.1.2(월) - Web data(vs code) ,시카고 샌드위치 50(url)

화이팅·2023년 1월 5일
0

zbase

목록 보기
14/17
  • html

특정 태그 확인
soup.findall(class='outertext')
class 와 중복되므로 class
로 작성

  • 위키백과 주소 한글일 때, 문서 정보 가져오기

html='https://ko.wikipedia.org/wiki/{search_words}' # %EC%97%AC%EB%AA%85%EC%9D%98_%EB%88%88%EB%8F%99%EC%9E%90

req=Request(html.format(search_words=urllib.parse.quote('여명의 눈동자'))) # 글자를 url로 인코딩
response=urlopen(req)
response.status # 200이면 성공
soup=BeautifulSoup(response, 'html.parser')
print(soup.prettify())

  • 예제 : 시카고 맛집 데이터 분석
  1. url 불러오기

from urllib.request import Request.urlopen # urllib.request : 관련 네트워크 프로토콜을 사용하여 많은 url스킴에 대해 url가져오는 것 지원(http://)
from bs4 import BeautifulSoup
url_base='https://www.chicagomag.com/'
url_sub='chicago-magazine/november-2012/best-sandwiches-chicago/'

-urllib.request : url 가져오기 위한 파이썬 모듈
-urllib.parse() : url 자동으로 쪼개줌

22.1.4(수)

  • 정규식
    re.search("$\d+.(\d+)?",price_Tmp) # $로 시작 + 숫자 + . + 숫자가 올 수도 or 안 올 수도
profile
하하...하.

0개의 댓글