Ch 01. 데이터 분석을 시작하며 데이터 분석이란? > 유용한 정보를 발견하고 결론을 유추하거나, 의사 결정을 돕기 위해 데이터를 조사, 정제, 변환, 모델링하는 과정 데이터 과학이란? > 데이터 분석과 자주 언급되는 데이터 과학은 통계학, 데이터 분석, 머신러닝
프로그램이 서로 대화하기 위한 방법을 정의한 것웹기반 API는 웹 서버와 웹 브라우저가 대화하는 방식과 비슷하다.HTTP 프로토콜을 사용하지만 HTML을 주고받는 것이 아니라 일반적으로 CSV, JSON, XML 같은 파일을 사용한다.보통 웹기반 API에서는 CSV보다
프로그램으로 웹사이트의 페이지를 옮겨 가면서 데이터를 추출하는 작업웹 크롤링(Web Crawling)이라고도 부른다.원하는 열 이름을 리스트로 만들어서 데이터프레임의 인덱스처럼 사용하면 된다.Ioc는 메서드이지만 대괄호를 사용해서 행의 목록과 열의 목록을 받는다.첫 번
데이터에서 손상되거나 부정확한 부분을 수정하고, 불필요한 데이터를 삭제하거나 불완전한 값을 교체하는 등의 작업.데이터 정제는 데이터를 분석 목적에 맞게 변환하는 데이터 랭글링(Data Wrangling), 데이터 먼징(Data Munging) 의 일부로 수행될 수 있다
데이터프레임 정보를 요약해서 출력해주는 함수info() 메서드를 사용하면 열마다 NaN이 아닌 값의 개수를 확인할 수 있다.NaN 값을 직접 카운트 하는 함수, 각 행이 비어있는지를 나타내는 불리언 배열을 반환한다. (비어있는 행은 True로 표시)이어서 sum() 메
💡 기술 통계란? (Descriptive Statistics)테크니컬한 어떤 기술적인 부분을 지칭하는 것이 아니라 자료의 내용을 압축하여 설명하는 방법이다.요약 통계(Summary Statistics) 라고 부르기도 한다.정량적인 수치로 전체 데이터를 요약하거나 이해
모든 그래프 구성요소를 담고 있는 최상위 객체그래프 크기 변경하기: figsize 매개변수 (그래프를 그리는 캔버스 크기)figure() 함수를 사용하여 객체를 만들면 그래프 옵션을 조절할 수 있다.figsize 매개변수에 그래프 크기를 튜플로 지정기본 그래프 크기는
pyplot 방식으로 그래프 그리기matplotlib.pyplot에 있는 함수를 사용하면 함수들이 하나의 figure 객체에 대한 상태를 공유한다.객체지향 API 방식으로 그래프 그리기하나의 figure에 여러 개의 subplot을 추가할 때 자주 사용한다.폰트 지정하
처음에 데이터 분석에 관심을 가지게 된 계기는 막연했던 것 같다.파이썬을 배운 적도 없었고, 그렇다고 데이터 분석 업무를 하고 있는 것도 아니었다.어떻게 보면 단순하게 주변에서 계속 데이터가 어쩌고 저쩌고 하니까 자연스럽게 관심이 생겼고, 최근에 회사를 이직하면서 동료