웹 크롤링
열고 닫기가 필요
<html> </html>
from bs4 import BeautifulSoup
크롬 개발자 도구의 html 문서 정보 이용하여 추출, 정렬, dataframe 만들고 엑셀 파일 저장하기
import urllib
from urllib.request import Request
*
html = "https://ko.wikipedia.org/wiki/{search_words}"
req = Request(html.format(search_words=urllib.parse.quote("여명의_눈동자")))
*
response = urlopen(req)
soup = BeautifulSoup(response, "html.parser")
soup
1)
2)
3) * ~ *
반복문(for)에서 사용하는 방법이 다른 언어에 비해 편하다
in 명령으로 조건문(if)에 적용하는 것도 역시 다른 명령에 비해 편하다
append : list 맨 뒤에 하나 추가
pop : 맨 뒤 자료를 지움
extend : 맨 뒤에 다수의 자료 추가
remove : 같은 이름의 자료를 지움
movies.append(['베', '아', '당'])
print(movies)
# 결과
['그', '가', '디', '먼', ['베', '아', '당']]
movies.extend(['베', '아', '당'])
print(movies)
# 결과
['그', '가', '디', '먼', '베', '아', '당']
.x : 임의의 한 문자를 표현 (x가 마지막으로 끝난다)
x+ : x가 1번 이상 반복된다
x? : x가 존재하거나 존재하지 않는다
x* : x가 0번 이상 반복한다
x|y : x 또는 y를 찾는다 (or 연산자를 의미한다)
https://zephyrus1111.tistory.com/305