✏️ 24.12.18 TIL

Dada·2024년 12월 18일

1. Pandas의 자료 구조

데이터프레임
- 2차원의 데이터 구조
- index: 각 아이템을 특정할 수 있는 고유값
- 행(row), 열(column)으로 구성
- 각 열은 각각 데이터타입(dtype)을 가짐
시리즈
- 데이터를 담는 차원 배열 구조를 가짐
  → 데이터 프레임의 컬럼 하나
- 인덱스(index) + value
- 데이터타입을 가짐

2. rename

# df의 'org_name' 컬럼명 교체
df.rename(columns = {'org_name': 'new_name'}, inplace = True)

3. DataFrame.keys()

df.keys()

4. 데이터 확인

df.shape
# 출력 : (행 개수, 열 개수)

df.dtype

df.columns

5. 데이터 병합

concat
- axis=1 : 열 방향 - 좌, 우로 합치기
- axis=0 : 행 방향 - 위, 아래로 합치기
- ignore_index : 기존 인덱스를 무시할 것인지 여부

pd.concat([df1, df2, df2, axis = 0, ignore_index = True])

pd.merge(df1, df2, how = "inner", on = "column_name")

6. 데이터 저장

# 한글깨짐 현상 방지: encoding = "UTF-8-SIG"
df.to_csv("filename", encoding = "UTF-8-SIG", index = True)

df.to_excel("filename", index = True)