pandas는 기본적인 수학/통계 메소드를 가지고 있다.
30분만에 판다스 입문하기
https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html
.isnull()
은 결측치 여부를 판별한다. (있으면 True
, 없으면 False
)isnull()
, value_counts()
등의 다른 메소드와 함께 사용할 수 있다.print(data['컬럼 A'].corr(data['컬럼 B']))
data.drop(['Latitude','Longitude','Country','Date','HospitalizedPatients', 'IntensiveCarePatients', 'TotalHospitalizedPatients','HomeConfinement','RegionCode','SNo'], axis=1, inplace=True)
- count(): NA를 제외한 수를 반환
- describe(): 요약 통계를 계산
- min(), max(): 최소, 최댓값을 계산
- sum(): 합을 계산
- mean(): 평균을 계산
- median(): 중앙값을 계산
- var(): 분산을 계산
- std(): 표준편차를 계산
- argmin(), argmax(): 최소, 최댓값을 가지고 있는 값을 반환
- idxmin(), idxmax(): 최소, 최댓값을 가지고 있는 인덱스를 반환
- cumsum(): 누적 합을 계산
- pct_change(): 퍼센트 변화율을 계산