[SpringBoot] 셀레니움을 통해 웹스크래핑하기

임유빈·2022년 8월 30일

https://chromedriver.chromium.org/downloads

크롬 접속 후 최신버전 다운로드 (도움말 > 정보에서 버전 확인 후 해당 버전의 가장 최신 버전 exe 다운받기)

implementation 'org.seleniumhq.selenium:selenium-java'

gradle에 추가


@Service
public class SeleniumExample {
	//다운받은 드라이버 (프로그램) 명과 경로(경로 끝에 프로그램명.exe 작성)

    private WebDriver driver;
    private static final String WEB_DRIVER_ID = "webdriver.chrome.driver";
    private static final String WEB_DRIVER_PATH = "D:/chromedriver_win32/chromedriver.exe";
    private String base_url;

	//setProperty 메소드를 통해 프로그램명과 경로 받기
    //base_url에 스크래핑 할 브라우저 url 작성
    public void scraping() {
        System.setProperty(WEB_DRIVER_ID, WEB_DRIVER_PATH);
        driver = new ChromeDriver();
        base_url = "http://ncov.mohw.go.kr/bdBoardList_Real.do?brdId=1&brdGubun=13";
        driver.get(base_url);

        try {
            Thread.sleep(5000);

            List<WebElement> elements_span = driver.findElements(By.tagName("span"));
            int checkNum1 = 0;

            for(WebElement e : elements_span) {
                System.out.println(checkNum1);
                System.out.println(e.getText());
                checkNum1++;
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            driver.quit();
        }
    }
}

tset 모듈에 작성 후 실행 > 테스트 통과 성공


[참고] https://todaycode.tistory.com/5

0개의 댓글