[Python] 이미지 스크래핑

정현석·2020년 10월 4일

[ 스파르타 코딩 ] 

import dload
from bs4 import BeautifulSoup
from selenium import webdriver
import time

driver = webdriver.Chrome('chromedriver') # 웹드라이버 파일의 경로
driver.get("https://search.daum.net/search?w=img&nil_search=btn&DA=NTB&enc=utf8&q=%EC%95%84%EC%9D%B4%EC%9C%A0")
time.sleep(5) # 5초 동안 페이지 로딩 기다리기

req = driver.page_source
# HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
# soup이라는 변수에 "파싱 용이해진 html"이 담긴 상태가 됨
# 이제 코딩을 통해 필요한 부분을 추출하면 된다.
soup = BeautifulSoup(req, 'html.parser')

thumbnails = soup.select('#imgList > div > a > img')
#             copy select 로 이미지 주소 복사 div 안에 a안에 이미지 만 찾아 thumbnails에 저장
i = 1
for thumbnail in thumbnails :
    img = (thumbnail)['src']
    # for 문을 실행하여 전체 이미지 중 src 만 img에 저장
    dload(img , f'img/ {i}.jpg')
    # dload 라이브러리를 사용하여 지정한 위치에 저장 (파일이름 설정가능)
    
    i += 1
driver.quit() # 끝나면 닫아주기

정현석

기록하는 벨로그

이전 포스트

[Python]Web Scraping-2

다음 포스트

[Python] 이미지 스크래핑

[Python]Web Scraping-2

[Python] 뉴스 스크래핑

0개의 댓글