이미지 데이터 수집 Selenium

Happy_JG·2023년 8월 29일
0

크롤링

목록 보기
7/8

기본 라이브러리 호출

from selenium import webdriver as wb
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

라이브러리 추가 호출

import os #파일 시스템을 위한 라이브러리(삭제, 생성)
from urllib.request import urlretrieve #이미지 경로를 실제 파일로 저장하는 라이브러리

1. 이미지 파일을 다운받기 전에 바탕화면에 폴더 생성

#바탕화면에 이미지라는 폴더가 없다면 바탕화면에 이미지라는 폴더를 만들자.
if not os.path.isdir("C:/Users/gjaischool/Desktop/이미지"):
	os.mkdir("C:/Users/gjaischool/Desktop/이미지")

2. 네이버 푸바오 이미지 검색 및 이미지 태그 수집

driver = wb.Chrome()
driver.get("https://search.naver.com/search.naver?where=image&sm=tab_jum&query=%ED%91%B8%EB%B0%94%EC%98%A4")
img = driver.find_elements(By.CSS_SELECTOR,"._image._listImage")

3. 이미지 태그 안에 있는 속성(이미지 경로)을 가지고 오기

img[0].get_attribute("src")

#'https://search.pstatic.net/common/?src=http%3A%2F%2Fblogfiles.naver.net%2FMjAyMzA2MjJfNzcg%2FMDAxNjg3NDQzNzMxNTEw.LMYyB5V2r7yLTVkAoHmhm5SNDUCdYN835vCvbhyP5-Yg.hQq4mezI-6w3R1t8aOnUVHRHJPGwIteYg6GoozaBNusg.PNG.trric%2F%25BD%25BA%25C5%25A9%25B8%25B0%25BC%25A6_2023-06-22_%25BF%25C0%25C8%25C4_11.18.46.png&type=a340'

4. 이미지 가공
src만 담는 리스트 생성

src = []
for i in range(len(img)):
	src.append(img[i].get_attribute("src"))

5. 파일로 저장

for i in range(len(src)):
    urlretrieve(src[i],"C:/Users/gjaischool/Desktop/이미지/" + str(i) +".jpg")

업로드중..

profile
hello!

0개의 댓글