Python Web Crawling 기초

bi_sz·2022년 3월 31일

Crawling anaconda chromedriver python selenium vscode

Python

목록 보기

12/15

크롤링 Crawling

Web상에 존재하는 Contents를 수집하는 작업 ( 프로그래밍으로 자동화 가능)
-HTML 페이지를 가져와서, HTML/CSS 등을 파싱하고, 필요한 데이터만 추출
-Open API (Rest API) 를 제공하는 서비스에 Open API를 호출해서, 받은 데이터 중 필요한 데이터만 추출
-Selenium등 브라우저를 프로그래밍으로 조작해서 필요한 데이터만 추출

크롬웹브라우저와 Selenium을 사용하여 Python으로 간단한 웹 크롤링을 해보려 합니다.

chromedriver 에서 Chrome 버전과 맞는 ChromeDriver 을 받아줍니다.

Chrome 버전 100.0.4898.60 을 확인해 줍니다.

동일한 버전을 받아줍니다.

flask_env 가상환경을 활성화 시켜준 후 pip install selenuim 셀레니움을 설치해줍니다.

필요한 라이브러리를 import 합니다.

import selenium
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
import time