데이터프레임의 크기(행,열)
- df.shape -> 행과 열의 개수를 튜플 형태로 리턴한다.
데이터프레임의 기본 정보
- df.info() 메소드 -> 데이터프레임에 관한 기본정보 시리즈 형태로 리턴
클래스 유형,
행 인덱스의 구성,
열이름의 종류와 개수,
각 열의 자료형과 개수,
메모리 할당량에 관한 정보...
데이터프레임의 기술 통계정보 요약
- df.describe() 메소드 -> 숫자데이터를 갖는 열에 대해 주요 기술 통계 정보를 데이터프레임형태로 리턴한다.
평균,
표준편차,
최대값,
최소값,
중간값 등..
describe() 메소드에서 include='all' 옵션을 이용하면 숫자에 대한 통계정보 뿐만 아니라 문자열 데이터가 들어있는 열의 unique(고유값 개수), top(최빈값), freq(빈도수) 에 대한 정보가 추가된다.
데이터 개수 확인
: info() 메소드는 각 열의 데이터 개수 정보를 출력하지만 리턴값이 없어서 다시 사용하는데 어려움이 있다.
평균값
중간값
최댓값
최소값
표준편차
상관계수
- corr() 메소드 -> 숫자데이터를 갖는 모든 열의 표준편차값을 시리즈 형태로 리턴한다.