오늘은 Python을 통한 시각화에 대해 알아볼 것이다. 시각화란 무엇이고, 왜 하며, 어떻게 구현하는가? 01 시각화의 두 가지 목적 시각화는 데이터 분석을 용이하게 한다. 예컨대 수치/정량으로만 나타낸 데이터의 한눈에 파악하는 것은 어렵다. 특히나 outlier
지난 포스팅에 이은 데이터 분석과 시각화 두 번째 시간. 07 파이 그래프 선그래프와 막대, 파이 그래프의 문법을 정리해보자. 선그래프 > .plot() .plot(kind = 'line') 막대그래프 > .plot(kind = 'bar') .plot(kind
EDA 를 알아보자: violinplot, jointplot, corr() 찍어보기.
통계 기본 상식 중 하나인 상관계수와 heatmap 보여주기
앞서 pandas 에 내장된 그래프를 통해 그래프를 그렸으나, 지금 살펴볼 Seaborn이 더 다양하고 근사한 그래프들을 지원한다고 한다. 📌 Seaborn알아보기확률 밀도 함수란 데이터셋의 분포이다. 영어로는 Probability Density Function이다.
더 다양한 메서드들을 알아보자.
데이터프레임 병합의 네 가지 방버에 대해서 알아보자!
웹 스크래핑실시간 검색어 수집자동 메일 발송자동 블로그 포스팅하이퍼텍스트(HyperText) 는 텍스트 너머 무언가를 의미한다. 과거에 활자가 종이로 인쇄된 형태로만 정보가 존재했을 떄는 책을 읽다가 모르는 내용이 나오면 일일이 다른 책을 다 찾아보아야 했다.그러나 웹
request 라이브러리를 통해 파이썬에서 서버로 요청을 보내고 HTML 태그를 받아오는 방법
HTML 코드를 분석해보자. 각 태그들에 대해 알아보자. CSS 에서 HTML ID, 클래스 태그를 잡는 각각의 방법과 AND, OR, 중첩, 직속, 모든 태그를 잡는 방법
Beautiful Soup4 라이브러리를 통하여 웹에서 내가 원하는 정보를 추출하는 방법을 알아보자.
Beautiful Soup 에서 필요한 태그를 선택하는 두 가지 방법. 내가 가져오고 싶은 정보를 택하고 엑셀 파일로 저장하기(혹은 csv 파일)
01 Selenium > ✅ Selenium 이란? 브라우저를 자동화하는 도구. 클릭, 스크롤, 입력 등을 미리 설정해두면 코드에 의해 웹사이트가 자동으로 동작하는 것이다. 웹 사이트 테스트를 위해 사용. 02 Selenium 준비하기
selenium 으로 웹 동작하면서 필요한 정보 긁어모으기, 정보 엑셀로 저장.
좋은 데이터란 무엇일까?란 의문에 답.
좋은 데이터를 만들기 위해 값 넣기, 삭제하기, 행과 열 바꾸기 등을 scatter 를 보면서 수행한다