EDA 환경설정 주피터 노트북 vscode colab
프로젝트 개요: 서울시 CCTV 분석(왕초보용..ㅎ)프로젝트 목표서울 인구수와 CCTV 개수로 구별 그래프를 그리고 경향선을 기준으로 데이터를 강조하자데이터는 공공데이터 사이트, 통계청 등등 다양한 곳에서 찾을 수 있다.프로젝트 시작!pandas를 이용하여 파일을 읽고
EDA 1 프로젝트를 진행하면서 필요한 Pandas와 matplotlib 기초 정리 Python에서 R만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈단일 프로세스에서는 최대 효율코딩이 간소하고 응용가능한 엑셀로 받아들여도 됨누군가 스테로이드 맞은 엑셀로 표현Serie
강남 3구의 범죄 안전률 구하기csv로 저장되어 있는 서울시 범죄 현황 데이터 파일을 pandas로 읽어온다.서울시 범죄 현황 데이터를 pivot으로 정리하고 컬럼을 정리한다.
pandas pivot tableindex, columns, values, aggfuc데이터를 손쉽게 정리하여 한눈에 보기 위해 pivot 사용인덱스와 컬럼, 값을 설정하여 정리할 수 있다. import googlemapsgmaps_key = "Your API"gmap
Beautiful SoupHTML정보로 부터 원하는 데이터를 가져오기 쉽게, 비슷한 분류의 데이터별로 나누어주는 파이썬 라이브러리(보통 html정보를 가져오는 urllib.request.urlopen() 모듈과 함께 사용되곤 한다.)Beautiful Soup을 사용하여
총 51개 페이지에서 각 가게의 정보를 가져온다 가게이름 대표메뉴대표메뉴의 가격 가게주소메인페이지의 html을 불러와 메인화면에 있는 맛집 이름, 메뉴, 랭킹, url을 찾아 데이터프레임 생성찾은 정보를 리스트에 담아 데이터프레임 생성메인페이지에 있는 각 맛집의 url
selenium은 웹사이트 테스트를 위한 도구로 브라우저 동작을 자동화할 수 있다. 프로그래밍으로 브라우저 동작을 제어해서 마치 사람이 이용하는 것 같이 웹페이지를 요청하고 응답을 받아올 수 있다. Selenium 사용하기크롬 드라이버를 다운로드하여 크롬으로 웹페이지를
사이트에서 지역 검색기능을 상요하기 위해 선택가능한 지역정보 크롤링 서울만을 기준으로 서울은 고정하고 구별 검샘을 통해 구별 셀프 주유소 정보 가져와 엑셀 저장 버튼을 클릭하여 데이터 저장 - 반복문 사용다운로드 된 파일들을 concat으로 병합하고 데이터를 사용하기
네이버 개발자 센터https://developers.naver.com/main/Application어플리케이션 등록어플리케이션 이름 ds_study사용 API검색데이터랩(검색어트렌드)데이터랩(쇼핑인사이트)환경추가WEB 설정http://localhost
인구소멸 위기 지역 파악인구소멸 위기 지역의 지도 표현지도 표현에 대한 카르토그램 표현데이터 가져와서 전처리하고 소멸위험 비율(20~39세 여자인구/65세 이상 인구)을 계산하여 소멸위기지역 확인데이터가져오기컬럼과 값 이름 수정소멸위험비율을 구하기위해 칼럼 생성소멸위험