[5주차] 유가분석

이철민·2023년 3월 5일
0

셀레니움 기초

[셀레니움 설치 & 기초]

  • 셀레니움 설치
    • pip install selenium (mac m1)
    • 인스타그램, 페이스북처럼 계속 스크롤 할 수 있는 동적 페이지의 데이터를 가져올때 사용
  • 셀레니움
    • 웹 브라우저를 원격 조작하는 도구
    • 자동으로 URL을 열고 클릭 등이 가능
    • 스크롤, 문자의 입력, 화면 캡처 등등
  • 코드 변동 주의
    • from selenium.webdriver.common.by import By 모듈
    • find_element_by_css_selector('css selector') -> find_element(By.CSS_SELECTOR, 'css selector')
  • 셀레니움 webdriver 시작하기
  • 셀레니움 기본 동작
  • 셀레니움 화면 스크롤
  • 셀레니움 검색어 입력
  • 셀레니움과 BeautifulSoup 함께 사용하기

[셀레니움으로 주유소 데이터 얻어오기]

  • 지역을 서울로 고정하고 서울의 모든 구 엑셀 다운받기

[ 주유소 가격 정보 정리하기]

import pandas as pd
from glob import glob
  • 파일 목록 한 번에 가져오기

    • glob('../data/지역 *.xls)
  • 파일명 저장

  • concat 으로 모든 주유 엑셀 데이터 합치기
  • 데이터 프레임 제작
  • 데이터 프레임 컬럼에 '구' 추가
  • 가격 데이터형 변환 ( object -> float)
  • 인덱스 재정렬
  • 인덱스 삭제

[주유 가격 시각화]

  • 1) boxplot (feat.pandas)

  • 2) boxplot (feat.seaborn)

  • 3) boxplot (feat.seaborn)

    • 셀프 여뷰, 상표별 휘발유 가격

  • 지도 시각화
import json
import folium
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
  • 가장 비싼 주요소 10개
  • 가장 저렴한 주유소 10개
  • 구별 가격 평균 값
  • 지도 시각화

-> 마지막 시각화 오류.. 체크해볼 것!

profile
늘 온 마음을 다해 :)

0개의 댓글