82일차 시작.... (웹 크롤링)

조동현·2022년 11월 2일
0

[교육] Python Analysis

목록 보기
4/15
post-thumbnail

📊 웹 크롤링을 위한 라이브러리


📌 R Selenium 이란?

  • Selenium
    웹 브라우저를 원격 조작할 때 사용하는 도구이며 주로 웹 앱을 테스트하는데 이용하는 프레임워크다.

  • 기능
    - 자동 URL 열기 동작
    - 크롤링, 문자입력, 화면캡처 등의 다양한 작업 가능
    - webdriver 라는 API를 통해 운영체제에 설치된 브라우저를 제어

  • 웹 브라우저 직접 제어란?
    JavaScript를 이용해 비동기적으로 혹은 뒤늦게 불러와지는 컨텐츠를 scraping 하는 것


📌 R Selenium 설치 및 사용 방법

  • 설치
    1. selenium 설치 : anaconda prompt pip install selenium
    2. 브라우저 버전 업데이트 : 크롬 설정 chrome 정보
    3. 크롬 브라우저 드라이버 설치 : 현재 크롬 브라우저 버전에 맞는 설치 파일 선택

  • 사용 방법
from selenium import webdriver
browser = webdriver.Chrome('C:/work/chromedriver')
browser.get('http://www.google.com/xhtml');
search_box = browser.find_element('name', 'q')
search_box.send_keys('검색단어')
search_box.submit()
time.sleep(5)
browser.quit()









profile
데이터 사이언티스트를 목표로 하는 개발자

0개의 댓글