Beautiful Soup 만드로 해결할 수 없을 때 Selenium으로 사용 함
Selenium
Selenium 4.3 버전부터는 옵션 설정하는 방법이 변경되었다.
Selenium 설치 명령어
크롬 드라이버 설치시 크롬의 버전을 확인하고 그에 맞는 버전으로 설치해야한다
샐레니움을 이용해서 처음으로 접근해보기
스크롤이 가능한 높이를 가져오자
화면 스크롤
개발자 도구는 컴퓨터의 경우 주로 f12, 노트북의 경우 ctrl + shift + I로 열 수 있다
xpath로 찾기(크롬개발자도구 활용)
찾은 xpath 지점까지 스크롤하는 코드
id로 검색창 찾기
찾은 검색창에 검색할 단어 입력하기
검색버튼의 태그를 찾아서 검색을 실행하기
버튼을 클릭하는 코드를 실행
현재 화면의 html코드 가져오기
찾고자 하는 목록이나 결과물의 태그를 찾아서 불러올수있다
데이터 확보하기 위한 작업
데이터 접근하기
광역시도를 선택하는 곳 부터 검색 도전하기
두번째 리스트인 시/군/구 항목도 동일하게, id와 option을 확인
반목문으로 모든 구의 데이터를 엑셀 파일로 저장
파일을 관리할 수 있는 모듈을 불러와 파일 목록을 한번에 가져오기
불러온 파일 목록을 저장
저장한 파일 목록을 하나씩 읽어올 수 있다
concat 함수를 사용하여 결합하기
컬럼명을 보기좋게 다듬는다
평균적으로 주유가격이 비싼 구를 확인하기 위해 주소에서 구 정보를 가져오지
가격 정보가 없는 데이터는 제외하고 다시 불러오기
matplotlib 한글 대응
Box Plot
상자 전체 길이를 IQR(사분법위 : Inter Quatile Range)라고 한다
IQR의 1.5배 이상 벗어나면 점으로 별도 표기를 한다(Outlier : 이상점)
folium으로 지도에 시각화하기
데이터 불러오기
데이터 다듬기(피벗테이블 활용)
지도에 시각화(조건 설정)