전에 프로젝트를 하는 과정에서 chrome driver, selenium, bs4 설치를 다 했었지만, 컴퓨터를 바꾸기도 했고 크롬 버전도 바뀌어서 다시 설치하며 끄적인다.
텍스트 웹크롤링을 위해서는 보통 selenium과 bs4를 많이 사용한다.
selenium을 이용하여 텍스트 크롤링을 하기 전, 준비할 사항은 다음과 같다.
cmd 창이나 anaconda prompt 창에서 아래의 코드를 입력하면 된다.
pip install selenium
conda install selenium
웹 자동화를 위해 웹 드라이버를 설치해야 한다!
우측 상단 점 3개 선택 → 도움말 선택 → chrome 정보 선택 → chrome 버전 확인
웹 드라이버 다운을 위해 여기 https://chromedriver.chromium.org/downloads 를 클릭하면 된다. 다운 시 맥, 윈도우, 리눅스 등 자신의 os에 맞게 설치하면 끝!
아래의 코드를 입력했을 때 흰색 비어있는 크롬 창이 새롭게 생성된다면 제대로 설치한 것이다.
## selenium, webdriver 설치 확인
import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('chromedriver.exe') ## 크롬 드라이버가 위치한 경로 대입 필요