pandas모듈/DataFrame/Series/list 정리(2) 데이터 프레임 생성

허선우·2021년 5월 27일
1

PYTHON

목록 보기
9/17
post-thumbnail

지난 글에 이어 오늘은 데이터프레임을 생성하는 법을 알아보겠다.

데이터 프레임 생성

1. 판다스 임포트

import pandas as pd

2. 데이터 프레임 생성

student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531],
                             'name':['Kim', 'Lee', 'Jeong'],
                             'class':['H', 'W', 'S']})
student_card

3. 인덱스 지정

1.행 인덱스 지정

student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531],
                             'name':['Kim', 'Lee', 'Jeong'],
                             'class':['H', 'W', 'S']},
                             index = ['a', 'b', 'c'])   #행 index 지정
student_card

  1. 열인덱스(열이름)변경

열 인덱스 전체 변경

  • 열 인덱스 전체를 변경 할 때에는 변경할 이름을 리스트 형태로 적는다.
    student_card.columns 를 출력하면 student_card의 열 인덱스가 리스트 형태로 나오기 때문에 student_card.columns = [값2, 값2,값3]을 쓰면 된다.
    student_card.columns
    리스트를 업데이트 하면
    student_card.columns = ['아이디','이름,'성']
    열 인덱스 하나만 변경
    인덱스의 값을 하나만 변경하고 싶을 때는 rename메소드를 쓴다.
    데이터명.rename({'기존인덱스명':'바꿀 인덱스 명'},axis = 0(행인덱스) or 1(열인덱스), inplace = True)
    앞에서 말했듯이 DataFrame에는 열인덱스와 행 인덱스가 존재한다.
    그렇기때문에 axis를 통해서 행인덱스를 바꾸는지 열인덱스를 바꾸는지 명시해줘야 한다. 0은 행 인덱스를, 1은 열 인덱스를 뜻한다.
    이 상태에서는 기존의 데이터에서 업데이트되지 않기때문에 inplace = True를 써 변경사항이 저장되게 한다.
    #열인덱스(이름)을 NAME으로 변경
    student_card.rename({'이름':'NAME'},axis = 1,inplace = True)
    student_card

#행 인덱스 변경
student_card.rename({'b':'2'},axis = 0,inplace = True)

열 인덱스 변경

student_card = student_card.columns.str.lower()

student_card = student_card.columns.str.replace('s','S')

0개의 댓글