[Pandas] 그룹화 - groupby()

정만·2025년 4월 8일

데이터분석

목록 보기
52/61

groupby() ?

groupby 메서드는 데이터를 그룹화하여 연산을 수행하는 메서드이다.

-> 관련하여 넷플릭스 콘텐츠 평점에 대한 데이터 분석을 해보자.

그룹별 통계정보를 분석하고 싶을 경우 groupby함수를 사용할 수 있다.
예를들어 장르별 등등...

netflix_df.groupby('genre')
#장르별로 콘텐츠가 몇개씩 있는지 확인

netflix_df.groupby('genre').count()

netflix_df.groupby('genre').min(numeric_only = True)

장르별 숫자 데이터의 최소값을 확인해볼 수도 있다.

  • 컬럼 하나의 대해 알고 싶은 경우 아래와 같이 적용할 수 있다.
netflix_df.groupby('genre')['score'].mean()

-> score 컬럼의 평균치를 알 수 있다.

profile
멋있는 어른이 되고싶은 정만이의 벨로그

0개의 댓글