pandas
- 구조화된 데이터의 처리를 지원하는 python 라이브러리
- python의 엑셀
- 데이터 처리 및 통계 분석을 위해 사용
![](https://velog.velcdn.com/images/jeongjae96/post/dacd1758-503b-419e-9822-00691d3c663b/image.png)
series
![](https://velog.velcdn.com/images/jeongjae96/post/dd61e841-bbab-4fcb-949f-e74ab896a3f7/image.png)
dataframe
![](https://velog.velcdn.com/images/jeongjae96/post/d0db3d49-783d-44dd-9e98-b08c409db516/image.png)
- series를 모아서 만든 Data Table
dataframe indexing
![](https://velog.velcdn.com/images/jeongjae96/post/c6fd96d3-3b5d-4ea2-9ff3-9119be6bf74a/image.png)
lambda, map, apply
![](https://velog.velcdn.com/images/jeongjae96/post/e18f408b-3be8-4220-ae0a-25773665d701/image.png)
replace
- map 함수의 기능 중 데이터 변환 기능만 담당
- 데이터 변환 시, 많이 사용되는 함수
![](https://velog.velcdn.com/images/jeongjae96/post/96d61e2c-b3a1-4d80-9bec-67ccac267ea5/image.png)
apply
- series 전체(column)에 해당 함수를 적용
- 입력 값이 series 데이터로 입력 받아 handling 가능
![](https://velog.velcdn.com/images/jeongjae96/post/1be1c2b1-55c0-469b-a1d8-b86b1afffac1/image.png)
- 내장 연산 함수를 사용할 때도 똑같은 효과를 거둘 수 있다.
- mean, std 등 사용가능
![](https://velog.velcdn.com/images/jeongjae96/post/b0add362-c29d-4bba-9901-e3e348144bb6/image.png)
- scalar 값 이외에 series 값의 반환도 가능
![](https://velog.velcdn.com/images/jeongjae96/post/c0594df3-7d3c-4297-a7fa-3c6a27b3a9fb/image.png)
applymap
- series 단위가 아닌 element 단위로 함수를 적용한다.
- series 단위에 apply를 적용시킬 때와 같은 효과
![](https://velog.velcdn.com/images/jeongjae96/post/58c0eea4-f01b-445f-8ea9-87609dd2611c/image.png)
pandas built-in functions
describe
- Numeric type 데이터의 요약 정보를 보여준다.
![](https://velog.velcdn.com/images/jeongjae96/post/a318474f-4d8a-4aad-9e3a-434ce436aa1b/image.png)
unique
- series data의 유일한 값을 list로 반환한다.
![](https://velog.velcdn.com/images/jeongjae96/post/0cdeccad-dcb6-4d1d-b395-d0690ae7307c/image.png)
![](https://velog.velcdn.com/images/jeongjae96/post/f27d6050-eeb2-4070-8b99-2002d67e70a2/image.png)
sum
- column/row 값의 연산을 지원
- sub, mean, min, max, count, median, mad, var, ...
![](https://velog.velcdn.com/images/jeongjae96/post/2e57fff3-02f4-43f0-9f26-7cb0ce1d0f75/image.png)
isnull
- column/row 값의 null 값의 index를 반환한다.
![](https://velog.velcdn.com/images/jeongjae96/post/fee93d49-f7fc-4e24-9fd0-9bf56ec6c57f/image.png)
sort_values
- column 값을 기준으로 데이터를 sorting
![](https://velog.velcdn.com/images/jeongjae96/post/152349a0-6e5a-4163-80e9-6e8e26f55c16/image.png)
corr & cov
- 상관계수와 공분산을 구하는 함수
- corr, cov, corrwith
![](https://velog.velcdn.com/images/jeongjae96/post/fac1aba6-68a0-48eb-96bd-0db851433055/image.png)
![](https://velog.velcdn.com/images/jeongjae96/post/2d4dc318-2183-4cd4-bed5-9256c3dd2f4f/image.png)
실습
Python Basics for AI - pandas