pandas) df.columns.droplevel()
python) pip 이용하여 모듈 설치하는 명령어
pip install module_name
pandas) date_range
pandas) data frame
pandas) to_csv
데이터 정규화
seaborn) pairplot
seaborn) heatmap
pandas) read_csv() 함수를 통해 데이터를 읽어올 때, 특정 컬럼을 인덱스로 지정하는 옵션 : index_col
pandas) read_csv() 명령에서 thousands 옵션
- BeautifulSoup : 웹 수집을 위한 라이브러리
bs4) 실행
from bs4 import BeautifulSoup
bs4) 특정 id를 이용해서 원하는 내용을 찾는 법
soup.findall(id=‘some_id’)
bs4) ppp.com 웹페이지 열기 위한 명령어_단, urlopen으로 접근했음을 가정
BeautifulSoup("ppp.com", "html.parser")
bs4) soup이라는 변수에 어떤 사이트를 읽은 정보가 담겨있을 때, 특정 class를 이용해서 찾는 방법
soup.find("some_tag", "readable")
bs4) 태그를 찾은 결과에서 태그내의 글자를 가져오는 방법
soup.find_all("tag1", "class1")[0].string()
soup.find("tag2").get_text()
soup.find("tag1", "class1").get_text()
bs4) soup 이라는 변수에 어떤 사이트를 읽은 정보가 담겨있을 때, 특정 태그를 찾는 방법
soup.find("p")
soup.find_tag("p")
soup.find_all("p")
bs4) urllib의 quote함수역할
pandas) unique() 함수에 대한 설명
bs4) Request 함수를 사용할때 header 정보에 chrome 등 브라우저정보를 넣는 이유
Regular Expression 에서 000-0000-0000의 패턴을 지정하는 코드
\d+\s-\s\d+\s-\s\d+
bs4) 영화제목 태그를 가져오기 위한 코드
matplotlib) x축 데이터 표기의 축을 변환하는 코드
plt.xticks(rotation="vertical")
selenium) 특징
selenium) 셀레니움을 driver라는 변수로 초기화한 후 특정 홈페이지에 접근하는 명령
dreiver.get()
selenium) 셀레니움에서 웹페이지의 팝업창을 변환하는 명령(이때 셀레니움은 driver로 초기화되어 있음)
driver.switch_to_window()