Pandas 기초(1)

지은·2023년 8월 26일
0

데이터 분석 공부

목록 보기
1/2
post-thumbnail

📌헷갈리는 부분 요약
- row를 다룰 땐 loc, iloc을 사용한다.
- row나 column을 지정할 때는 대괄호를 사용한다.

1. Pandas란?

Pandas 라이브러리는 테이블형 데이터를 다룰 수 있는 데이터 분석 라이브러리이다.

Pandas로 데이터를 다루기 위해서는 데이터 타입에 대한 이해가 필요하다.

  • object (문자열)
  • int64 (정수)
  • float64 (부동소수점)
  • bool
  • datatime64 (날짜/시간)
  • timedelta[ns]

2. Series와 Dataframe

  • Series: 1차원 데이터
  • Data Frame: 2차원 데이터

3. Pandas 실습: Series

import pandas as pd

(1) 생성하기

series_data = pd.Series([5,10,15])

- 인덱스 지정하여 생성하기

series_data = pd.Series([5,10,15],index=['A','B','C'])

(2) 읽기, 수정하기

1) 인덱스 읽기

series_data.index

2) 인덱스 수정하기

series_data.index = ['AA','BB','CC']

3) values 읽기

series_data.values

4) 특정 데이터 지정하기

series_data['AA']
series_data[0]

(3) 삭제하기

del series_data['CC']

(4) 데이터 타입 변경하기 (astype)

series_data.astype(float)

4. Pandas 실습: Data Frame

(1) 생성하기

df = pd.DataFrame({
    'A':[90,80,70],
    'B':[70,70,80],
    'C':[80,80,80]},
    index = ['국어','영어','수학'])

(2) 읽기, 수정하기

1) 인덱스 읽기

df.index

2) 인덱스 수정하기

df.index = ['국','영','수']

3) 인덱스 이름 변경하기

df.index.name = '과목'

4) 컬럼 읽기

df.columns

5) 컬럼 추가하기

df['D'] = [60,60,60]

6) 컬럼 삭제하기

del df['D']

7) row 추가하기

row를 지정할 때는 loc를 사용한다.
컬럼, row를 지정할 때는 대괄호를 사용한다.

df.loc['사']=[70,80,90]

8) row 삭제하기 (drop)

데이터 프레임을 수정하기 위해서는 'df='을 작성해야 한다.

df = df.drop(['사'])

9) value 읽기

df.values

10) 특정 컬럼을 인덱스로 선택하기 (set_index)

df = df.set_index('과목')

11) 인덱스를 컬럼으로 변경하기 (reset_index)

df=df.reset_index('과목')

12) 특정 row 가져오기 (loc, iloc)

df.iloc[0]
df.loc['국어']

13) 특정 컬럼 가져오기

df['A']

14) 복사하기

df2 = df[['A','B']].copy()
df3 = df.loc[['국어']].copy()

0개의 댓글