pandas
- 구조화된 데이터의 처리를 지원하는 python 라이브러리
- python의 엑셀
- 데이터 처리 및 통계 분석을 위해 사용
series
dataframe
- series를 모아서 만든 Data Table
dataframe indexing
lambda, map, apply
replace
- map 함수의 기능 중 데이터 변환 기능만 담당
- 데이터 변환 시, 많이 사용되는 함수
apply
- series 전체(column)에 해당 함수를 적용
- 입력 값이 series 데이터로 입력 받아 handling 가능
- 내장 연산 함수를 사용할 때도 똑같은 효과를 거둘 수 있다.
- mean, std 등 사용가능
- scalar 값 이외에 series 값의 반환도 가능
applymap
- series 단위가 아닌 element 단위로 함수를 적용한다.
- series 단위에 apply를 적용시킬 때와 같은 효과
pandas built-in functions
describe
- Numeric type 데이터의 요약 정보를 보여준다.
unique
- series data의 유일한 값을 list로 반환한다.
sum
- column/row 값의 연산을 지원
- sub, mean, min, max, count, median, mad, var, ...
isnull
- column/row 값의 null 값의 index를 반환한다.
sort_values
- column 값을 기준으로 데이터를 sorting
corr & cov
- 상관계수와 공분산을 구하는 함수
- corr, cov, corrwith
실습
Python Basics for AI - pandas