[data science] 누적값 계산

덴장·2026년 4월 17일

data

목록 보기
18/55
df1 = pd.read_csv('data/revenue.csv')
df1

df.sum()

#누적합계

df1['revenue'].cumsum()

df1['revenue_cumsum'] = df1['revenue'].cumsum()
df1

df1.plot(x='month', y='revenue_cumsum')

df1.plot(x='month', y='revenue_cumsum', kind='bar')

df_interest = pd.read_csv('data/interest.csv')
df_interest

1000000 * (1+0.0546)
1054600.0

1000000 * (1 + 0.0546) * (1 + 0.0471)
1104271.66

df_interest['multiple'] = df_interest['interest'] +1
df_interest

df_interest['cumulative_multiple'] = df_interest['multiple'].cumprod()
df_interest

*예제

user_df에는 세 개의 컬럼이 있는데, day는 서비스 오픈 후 경과일, register는 그 날 회원가입한 유저 수, unregister는 그 날 탈퇴한 유저 수.
새로 가입한 유저 수와 탈퇴한 유저 수를 고려해서, 일별 누적 유저 수를 한눈에 확인할 수 있도록 net_user_cumsum이라는 컬럼을 만들어서 아래와 같은 막대 그래프를 그릴것.

profile
개발자

0개의 댓글