- Selenium
웹 브라우저를 원격 조작할 때 사용하는 도구이며 주로 웹 앱을 테스트하는데 이용하는 프레임워크다.
- 기능
- 자동 URL 열기 동작
- 크롤링, 문자입력, 화면캡처 등의 다양한 작업 가능
- webdriver 라는 API를 통해 운영체제에 설치된 브라우저를 제어
- 웹 브라우저 직접 제어란?
JavaScript를 이용해 비동기적으로 혹은 뒤늦게 불러와지는 컨텐츠를 scraping 하는 것
- 설치
1. selenium 설치 : anaconda prompt → pip install selenium
2. 브라우저 버전 업데이트 : 크롬 설정 → chrome 정보
3. 크롬 브라우저 드라이버 설치 : 현재 크롬 브라우저 버전에 맞는 설치 파일 선택
- 사용 방법
from selenium import webdriver browser = webdriver.Chrome('C:/work/chromedriver') browser.get('http://www.google.com/xhtml'); search_box = browser.find_element('name', 'q') search_box.send_keys('검색단어') search_box.submit() time.sleep(5) browser.quit()