24.04.27 #개인프로젝트 기록

신규섭·2024년 4월 27일

개인 프로젝트

목록 보기
19/20

계획

의류 DB 생성

  • 스타일 테이블과 참조 연결
  • 스타일 카테고리 주입
  • 이미지 URL

흐름

첫번째 방법 : 이미지 URL, 스냅샷 제목, 다음 페이지로 넘어갈 URLsplit후 4번 인덱스의 숫자를 문자열에 담아두고 DB에 저장.

두번째 방법 : 다음 페이지의 요소들을 미리 크롤링 하여 DB에 저장.

스냅 페이지 크롤링

문제 발생

List<WebElement> images = driver.findElements(By.cssSelector("img"));

String imageUrl = image.getAttribute("src");
  • cssSelectorimg 태그를 가져오는데 src 이미지 주소를 찾지 못하고 분명 웹 내에서는 src가 존재하는데 크롤링 후 출력했을때 이미지가 blank로 찾지 못하고 있었다.

해결 (서명원님의 도움)

String imageUrl = image.getAttribute("data-original");

src태그 외에도 data-original라는 태그명이 존재 하고 있었고, 태그 내부에는 이미지 주소와 비슷한 형식으로 입력되어 있었다.
getAttribute에서 src 대신 data-original 태그를 넣어주고 실행하니 이미지 주소를 잘 가져왔다.

셀레니움

0개의 댓글