
주요 학습내용
외부에서 데이터 가져오기
실습 사용 자료
- 위키백과 : 여명의 눈동자
- https://ko.wikipedia.org/wiki/%EC%97%AC%EB%AA%85%EC%9D%98_%EB%88%88%EB%8F%99%EC%9E%90
- 최총 적으로 추출하고자하는 데이터
from urllib.request import urlopen, Request
html = "https://ko.wikipedia.org/wiki/%EC%97%AC%EB%AA%85%EC%9D%98_%EB%88%88%EB%8F%99%EC%9E%90"
- 이때, 주소를 복사하면, 기존 웹에서는 한글로 보였던 것이 깨져있는 것을 확인할 수 있다(인코딩이 깨져서 발생)
방법 1) 구글 검색

방법 2) format()사용
html = "https://ko.wikipedia.org/wiki/{search_words}"req = Request(html.format(search_words=urllib.parse.quote("여명의_눈동자"))) # 글자를 URL로 인코딩 ```python
response = urlopen(req)
response.status결과 확인
soup = BeautifulSoup(response, "html.parser")
print(soup.prettify())
# 주요인물 찾기
n = 0
for each in soup.find_all("ul"):
print("=>" + str(n) + "========================")
print(each.get_text())
n += 1
35번째에 있는 것 확인
soup.find_all("ul")[35].text.strip().replace("\xa0","").replace("\n", "")