2025.05.26 본_캠프 66일차

민동·2025년 5월 26일
1

본캠프

목록 보기
55/74
  • glob : 특정 폴더 안의 파일 목록을 패턴에 맞춰 가져오는 함수
    - 쉽게 말하면 "파일 이름 필터링해서 가져오기"

def extract_csvs():
    res = []
    for path in tqdm(glob("app_review_data/*.csv")):
        app_name = path.split("/")[-1].replace(".csv", "")
        df_temp = pd.read_csv(path)
        df_temp = df_temp.assign(app_name=app_name)
        res.append(df_temp)
    df = pd.concat(res)
    return df    
  • df에 대한 정보만 필요하지 쓸데 없이 df_temp에 대한 데이터는 필요 없음
  • 맥에서는 / 이지만 윈도우에서는 '\\'임을 생각
  • 변수역할사용 목적
    df_temp임시 저장소각 CSV 하나씩 읽고 가공할 때만 사용. 최종 결과 아님
    res누적 리스트모든 df_temp를 모으는 그릇
    df최종 결과respd.concat()해서 완성된 전체 데이터

%%time 이 하는 일

  • 셀 안의 코드가 실행되기 까지의 시간을 알려줌
  • 예를 들어 I/O 파일, 모델 학습, 데이터 처리 속도를 확인할때 유용
profile
아자아자

6개의 댓글

comment-user-thumbnail
2025년 5월 26일

이게 끝인가요?

1개의 답글
comment-user-thumbnail
2025년 5월 26일

오 내용이 생겼다

1개의 답글
comment-user-thumbnail
2025년 5월 29일

이게 정말 끝인가요...?

1개의 답글