[python][pandas] DataFrame.mode() 메서드

silver0·2022년 7월 13일

Python

목록 보기
4/6

pandas.DataFrame.mode()

mode메서드는 대상 행/열의 최빈값을 계산한다.
최빈값이 여러개일 경우 모두 표시해준다.

DataFrame.mode(axis=0, 
			   numeric_only=False, 
			   dropna=True)

매개변수

  • axis
    행(axis=0) : index) 또는 열(axis=1)을 기준으로 계산


  • numeric_only
    True일 경우 숫자, 소수, 부울값만 있는 열에대해서만 연산을 수행


  • dropna
    결측치를 계산에서 제외할지 여부. False일 경우 결측치도 계산에 포함



사용예제


1. 데이터프레임 전체 최빈값 구하기

df.mode()

각 열에 대해서 최빈값이 출력된다.
최빈값이 여러개일 경우 갯수만큼 인덱스가 생성되어 출력되고,
최빈값 이외의 값은 NaN을 출력


2. 숫자, 소수, 부울값이 아닌 열은 제외

df.mode(numeric_only=True)

numeric_only = True 인 경우 숫자, 소수, bool형태가 아닌 자료형을 갖는 열은 계산에서 제외된다.
1번 결과와 비교해보면, '선수'열은 제외되었음




[Reference]
https://wikidocs.net/155466

profile
작은 일이라도 꾸준히 노력하면 큰 뜻을 이룰 수 있다

0개의 댓글