'파이썬 머신러닝 판다스 데이터 분석' 책과 함께하는 따또의 데이터 분석 개념 정리
데이터프레임은 2차원 배열
인덱스를 활용한 다양한 DataFrame 정렬 및 변경
시리즈 객체와 데이터프레임의 산술연산
csv 파일 / excel 파일 / json 파일 불러오기
HTML 웹페이지에 있는 table 태그에서 표 형식의 데이터를 모두 찾아서 데이터 프레임으로 변환
구글 지오코딩(Geocoding) API 활용 예시
csv, json, excel에 데이터프레임 저장하기
데이터 미리보기 / 데이터 요약 정보 확인하기 / 데이터 개수 확인하기
평균값 / 중간값 / 최대값 / 최소값 / 표준편차 / 상관계수
판다스의 Matplotlib 라이브러리 기본 기능
Matplotlib를 통한 선그래프, 면적 그래프, 막대 그래프, 히스토그램, 산점도, 버블 차트, 파이 차트, 박스 플롯
Seaborn 라이브러리를 활용한 그래프 그리기
Folium을 통한 지도 활용법
누락 데이터 (NaN 값) 처리법
중복 데이터 확인 및 제거 방법
단위 환산 및 자료형 변환
구간분할과 원핫인코딩
숫자 데이터의 상대적인 크기 차이를 제거하는 정규화
Timestamp 와 Period
apply() 메소드, lambda 함수, applymap(), pipe() 메소드 활용
열 순서 변경, 열 분리
불린 인덱싱, isin() 메소드 활용
concat(), merge(), join()을 활용한 데이터프레임 연결, 병합, 결합
그룹 연산의 분할, 적용 및 결합
멀티 인덱스 사용 방법, loc 인덱서와 xs인덱서 사용법
피벗테이블 및 인덱서를 활용한 데이터 추출
머신러닝에 대한 간단한 설명, 지도학습과 비지도 학습, 머신러닝 프로세스
단순회귀분석, 다항회귀분석, 다중회귀분석
KNN, SVM, Decision Tree
군집 분석, K-Means