def extract_csvs():
res = []
for path in tqdm(glob("app_review_data/*.csv")):
app_name = path.split("/")[-1].replace(".csv", "")
df_temp = pd.read_csv(path)
df_temp = df_temp.assign(app_name=app_name)
res.append(df_temp)
df = pd.concat(res)
return df
변수 | 역할 | 사용 목적 |
---|---|---|
df_temp | 임시 저장소 | 각 CSV 하나씩 읽고 가공할 때만 사용. 최종 결과 아님 |
res | 누적 리스트 | 모든 df_temp 를 모으는 그릇 |
df | 최종 결과 | res 를 pd.concat() 해서 완성된 전체 데이터 |
%%time 이 하는 일
이게 끝인가요?