웹크롤링을 할 때 가장 많이 쓰이는 Selenium에 관하여 다뤄본다크롤링을 할 때 가장 많이 들어본 라이브러리는 BeautifulSoup일 것이다, 요즘은 JS로 동적구현을 한 사이트들이 많은데 BeautifulSoup은 동적인 동작을 실행해서 크롤링 할 수 없다.
다른 버전의 라이브러리나 프레임워크를 사용하고 싶을 때 매번 지웠다 깔았다 할 수 없으니 여러대의 컴퓨터를 사용하는 것마냥 가상환경을 만들어 사용할 수 있다.conda create -n 가상환경명 python=버전 으로 가상환경 생성conda activate 가상환경
matplotlib의 한글폰트 사용을 위해 매번 시작시 아래와 같은 코드 실행colab 에서도 위와 같은 문제 발생\-> pandas, Matplotlib등을 공부하기 좋은 데이터<목표>서울시 구별 CCTV 현황 데이터 확보인구 현황 데이터 확보CCTV 데이터와
python에서 R 만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈, 단일 프로세스에서는 최대효율 스테로이드 맞은 엑셀.... , 버전에 따라 문법이나 옵션이 달라 확인해야함from MODULE import function : MODULE에 포함된 function 하
matplotlib : 파이썬의 대표 시각화 도구주피터에서 새로운 창에서 그래프를 보는 것이 아니라 셀에 나타내기 위해서 %matplotlib inline 옵션 사용pyplot : matlab에 있는 시각화 기능들, 전체를 불러올 때는 mpl로 함plt.rcParams
데이터과학 이란? 시각화, 딥러닝 등 다양함!이번엔 가정 혹은 인식을 검증하고 표현하는 도구로써 사용데이터 : 서울시 관서별 5대 범죄현황의 2016년도 데이터숫자값들이 콤마(,)를 사용하고 있어 문자로 인식될 수 있다천단위 구분(thousands=',')이라고 알려주
인구수,CCTV와 살인,강도의 상관관계 확인인구수, CCTV와 살인검거율,폭력검거율 상관관계 확인검거율 heatmap, '검거' 컬럼을 기준으로 정렬현재 사용의 편의성이나 활발한 기능 개선 등으로 Folium이 만족도가 높은 편기본적으로 크롬에서 원활하게 동작함 기본적
HTML(Hyper Text Markup Language) : 웹 문서를 만들기 위하여 사용하는 기본적인 웹 언어의 한 종류.인터넷에서 웹을 통해 접근되는 대부분의 웹 페이지들은 HTML로 작성된다. 각종 태그들로 이루어져있으며 요새는 HTML5 표준을 사용! HEAD
한글이 포함된 웹페이지(URL)을 복사해 메모장이나 주피터셀에 복붙하면 이상하게 바뀌어서 나타난다, 웹주소는 UTF-8로 인코딩되어야 한다. => 구글에 URL Decode 검색해서 사용 또는 아래처럼 포맷팅! 스트링에서 중괄호( {} ),로 감싸주면 변수취급된다.
영화랭킹에서 평점순(현재상영영화) 선택접근 URL 확인웹 페이지의 주소에 많은 정보가 담겨있음, 원하는 정보를 얻기 위해 변화시켜야하는 주소의 규칙이 보이기도 함이 경우 날짜 정보를 변경해주면 해당 페이지에 접근이 가능하다매 페이지마다 가져오는 영화의 갯수가 다르다,