파일 처리

XTHK·2025년 3월 19일

Anaysis

목록 보기

3/25

import os

os.listdir()

pd.concat([df1, df2], ignore_index = True)

df1, df2을 concat (행 기준으로 이어붙임) -> 컬럼이 같은 것끼리 아래로 붙여짐
열 기준으로 붙일 때에는, (..., axis=1) -> 옆으로 붙여짐
ignore_index : 병합되면서 인덱스가 틀어지는 것 방지
- 기존 : 1,2,3,4, ... , 1,2,3,4, ...
- True로 설정 : 1,2,3,4,5,6,7,8, ...

df_concat.drop(columns = 'Unnamed: 0', inplace = True)

df1 = pd.read_csv('~~.csv')

pd.read_csv('~~.csv', skiprows=2)

기존에 컬럼이었던 사항들이 지정된 컬럼을 기준으로 variable, value 변수 내 값이 됨
- 예) 지점별 값 따로
  - variable : 지점컬럼
  - value : 각 지점이 가지던 값으로

df3.melt(id_vars = df3.columns[:4]

df3.rename(columns = {'variable' : '지점', 'value' : '판매량'})

df4['합계(int)'] = df4[' 합계'].astype(int)

df4.describe()

p2 = p1.set_index('지점')
p2.idxmax()

# 기간별 판매량 최대 지점
# 06월    (610)부천점
# 07월    (610)부천점
# 08월    (740)속초점

Analyse the world