pandas groupby의 효율성

이성범·2022년 4월 27일
0

Development

목록 보기
6/7
  • pandas의 == 를 통해서 원하는 index를 찾는 것 보다, groupby를 사용하면 더욱더 빠르게 원하는 값의 index를 찾을 수 있다.
  • 아래 code는 그 예시로, 방법1 보다 방법2가 더욱 빠르다.(pandas의 내부 요인에 의해서 발생하는 차이 같음)
# 방법1
df = pd.Dataframe()
feature_list = df[feature].unique()
for feature in feature_list:
	wont_df = df[df[feature] == feature]

# 방법2
df = pd.Dataframe()
group_df = df.groupby(feature)

wont_df = group_df.get_group(feature)

or

for feature, wont_df in group_df:
	```
    feature와 wont_df 사용
    ```
profile
Machine Learning Engineer at Konan Technology

0개의 댓글