22. 열 재구성

따또·2021년 7월 23일
0

Pandas DA

목록 보기
22/31
post-thumbnail

1) 열 순서 변경

import seaborn as sns

titanic = sns.load_dataset('titanic')
df = titanic.loc[0:4, 'survived':'age']

columns = list(df.columns.values)
# 열 이름을 list로 만들기

columns_sort = sorted(columns)
# 열 이름을 알파벳 순으로 정렬하기

df_sorted = df[columns_sort]
print(df_sorted)

import seaborn as sns

titanic = sns.load_dataset('titanic')
df = titanic.loc[0:4, 'survived':'age']

columns = list(df.columns.values)
# 열 이름을 list로 만들기

columns_reversed = list(reversed(columns))
# 열 이름을 기존 순서의 역순으로 정렬하기

df_reversed = df[columns_reversed]
print(df_reversed)

import seaborn as sns

titanic = sns.load_dataset('titanic')
df = titanic.loc[0:4, 'survived':'age']

columns = list(df.columns.values)
# 열 이름을 list로 만들기

columns_custom = ['pclass', 'sex', 'age', 'survived']
df_customed = df[columns_custom]
print(df_customed)

2) 열 분리

import pandas as pd

df = pd.read_excel('./주가데이터.xlsx')
print(df.head())
print('\n')

df['연월일'] = df['연월일'].astype('str')
# 연월일 데이터 형을 string 형으로 변환

dates = df['연월일'].str.split('-')
# '-'을 기준으로 데이터를 분리

df['연'] = dates.str.get(0)
# dates 변수의 원소 리스트 0 번째 인덱스 값

df['월'] = dates.str.get(1)
# dates 변수의 원소 리스트 1 번째 인덱스 값

df['일'] = dates.str.get(2)
# dates 변수의 원소 리스트 2 번째 인덱스 값
profile
따또의 DA 벨로그

0개의 댓글