<5주차_6일> DataFrame의 함수들

Nary Kim·2023년 6월 7일
0
post-thumbnail

0. pd[column_name][index]

tmp[("인구수","남자")]["속초시]  # 컬럼이 멀티인덱스일 때

1. pd.rename

딕셔너리 형태로 인덱스(index={:})나 컬럼(columns={:})의 이름을 바꿀 수 있다.

population.rename(
    columns={
    "행정구역(동읍면)별(1)": "광역시도",
    "행정구역(동읍면)별(2)": "시도",
    "계":"인구수"},
    inplace=True
)

2. get_level_values

pivot_table을 하면 컬럼이나 인덱스가 멀티가 되는 경우가 많기 때문에 이것을 다루기 위해 필요하다.

pop[pop.index.get_level_values(1)=='삼척시']

3. pd.loc[index][col_name] (pd.iloc은 인덱스에 숫자)

또는 pd.loc[index, col_name]

tmp.loc[["강릉시"]]
tmp.loc["강릉시"]

4. set_index

index를 지정하는 컬럼으로 설정.

tmp.set_index("시도",inplace=True)

5. merge

  • how
    - inner : 교집합
    • outer : 합집합
    • left, right: 각 방향 데이터를 기준으로 정렬
  • on : 기준이 되는 컬럼이 있으면 지정!
pop = pd.merge(pop, draw_korea, how = "left", on="ID")
profile
나는 무엇이 될것인가!!

0개의 댓글