최근 우리나라 경북지역에서 지진이 발생했었고, 수업시간에 기상청에서 기온을 크롤링 했어서 기상청 페이지에서 한번 더 실습해보는게 좋을 것 같아 선정하게 되었다.
국내 지진을 조회하는 사이트에 접속하여 발생한 날짜와 지진규모를 크롤링하여 dictionary형태로 만든 후 꺾은선 그래프를 통해 시각화
스크래핑에 필요한 라이브러리 불러오기
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.service import Service
from selenium.webdriver.common.by import By
기상청 사이트 실행, 최근 지진의 발생 시각과 규모 추출
driver = webdriver.Chrome(service = Service(ChromeDriverManager().install()))
driver.get("https://www.weather.go.kr/w/eqk-vol/search/korea.do?startSize=2.0&endSize=999.0&pNo=1&startLat=999.0&endLat=999.0&startLon=999.0&endLon=999.0&lat=999.0&lon=999.0&dist=999.0&keyword=&startTm=2022-01-01&endTm=2022-07-29&dpType=m")
driver.implicitly_wait(10)
for j in range(1,11):
date = driver.find_element(By.XPATH, "/html/body/div[2]/section/div/div[2]/div[2]/div[1]/table/tbody/tr[{}]/td[2]/span".format(j))
print(date.text)
for i in range(1,11):
element = driver.find_element(By.XPATH, "/html/body/div[2]/section/div/div[2]/div[2]/div[1]/table/tbody/tr[{}]/td[3]/span".format(i))
print(element.text)
### 2. 느낀점
수업때 배운 후 바로 과제로 연습하려니까 힘든 점이 있었다. 그래도 최대한 잘 해내고 싶어서 내가 해낼 수 있는 사이트를 찾으려 한참 헤메다 보니 모각코 예상시간의 절반 이상이 지나가 있었다. 수많은 사이트를 보다보니 새로운 지식도 얻고 아주 쓸모없는 시간은 아니었다. 결국 돌고 돌아 다시 기상청 사이트로 돌아왔는데 기상청 사이트에도 다양한 메뉴가 있어서 신기했다. 실습때와 마찬가지로 크롤링을 하는데 처음 하는 곳이다 보니까 힘들었지만 처음부터 차근차근 해나가니까 에러가 뜨지 않고 추출까지 성공했다! 지금은 시간이 부족에서 추출까지밖에 못했지만 못한 부분은 다음에 다시 해볼 예정!!