[PANDAS]pandas.DataFrameGroupby.sum() 옵션

Sophie·2023년 8월 22일
0

python

목록 보기
3/3

pandas.DataFrame.sum 파라미터

  • axis : 행, 열 계산 전환
  • skipna : NA/null 값을 무시할지 결정
  • numeric_only : float 형만 인식
  • min_count : 유효 값이 해당 옵션 이상이면 계산 나머지는 NaN 처리

이 글을 쓰게 된 이유는...
Groupby.sum은 옵션이 다르다^^

pandas.DataFrame.groupby.sum 파라미터

  • numeric_only
  • min_count

위 두개의 옵션뿐, 평소에 skipna 옵션을 잘 쓰고 있었는데 사용할 수 없어서 찾아보았고, 대신 min_count 를 사용할 수 있다는 것을 알게됨.

정확한 사용법이 헷갈려서 예시코드

df = pd.DataFrame.from_dict({'a':[float('nan'), 2, 3, 4],
                             'b':[float('nan'), float('nan'), 3, 4],
                             'c':[float('nan'), float('nan'), float('nan'), 4],
                             'd':[float('nan'), float('nan'), float('nan'), float('nan')]})
# 기본값, 유효한 값의 개수가 0(전부 NaN이면 0으로 표기)
df.sum(min_count=0)
# 유효한 값 1개 이상이면 계산
df.sum(min_count=1)
# 유효한 값 2개 이상이면 계산
df.sum(min_count=2)
# 유효한 값 3개 이상이면 계산
df.sum(min_count=3)

기본적인 건데 헷갈려서 적어두기ㅎ

profile
Now or Never

0개의 댓글