6일차 python 크롤링

차지예·2025년 5월 20일

생성AI

목록 보기

6/56

오늘은 크롤링하는 방법을 배웠기때문에 코드가 많을 예정이다
velog에는 간단한 문법적인 이야기만 적을 것이고
자세한 코드는 깃허브에 정리할 예정이다.

pip install requests
pip install beautifulsoup4
pip install selenium

response = requests.get('https://example.com')
html = response.text       # HTML 내용
status = response.status_code  # HTTP 상태 코드 (200, 404 등)

방식	예시
태그 이름으로	`find_element(By.TAG_NAME, 'a')`
클래스 이름으로	`find_element(By.CLASS_NAME, 'title')`
id로	`find_element(By.ID, 'search-box')`
name으로	`find_element(By.NAME, 'q')`
XPath로	`find_element(By.XPATH, '//div[@class="title"]')`
CSS 선택자	`find_element(By.CSS_SELECTOR, '.class > span')`