Pandas - 4

CYSSSSSSSSS·2023년 8월 11일
0

판다스

목록 보기
4/7

기본 집계

  • 데이터를 좀더 이해하기 위해 고유값 , 합 , 평균 , 최댓값 , 최솟값 등을 확인합니다.

고유값 확인

  • 고유값이란 열이 가진 값중에 유일한 값의 범주 인지 확인하는 것이다.
  • unique() 매소드를 사용해서 고유값을 확인한다.
print(data['MaritalStatus'].unique()) # MaritalStatus 열의 값중에 범주의 유일한 값들을 찾는다.

고유값의 개수 확인

  • 고유값이 몇개 갖고 있는지 확인하는것이다.
  • 다른 정보로는 컬럼의 이름과 , dtype 을 확인 할수 있다.
print(data['MaritalStatus'].value_counts())

기본 집계 메소드

sum

# MonthlyIncome 열 합계 조회
print(data['MonthlyIncome'].sum())

max

# MonthlyIncome 열 최댓값 조회
print(data['MonthlyIncome'].max())

mean

# 'Age', 'MonthlyIncome' 열 평균값 확인
print(data[['Age', 'MonthlyIncome']].mean())

median

# 'Age', 'MonthlyIncome' 열 중앙값 확인
print(data[['Age', 'MonthlyIncome']].median())

이때 2개이상의 열의 통계도 한번에 확인할수 있다.

profile
개발자 되고 싶어요

0개의 댓글

관련 채용 정보