DataFrame
- 행(row) 과 열(column) 로 이루어진 2차원 자료 구조
- 이미지 : 데이터프레임 구조
컬럼(Column) 선택
df["불러올 컬럼명"]
df = pd.DataFrame({"주문수": [3, 1, 4, 2], "판매가": [500, 1000, 2000, 5500]})
df["주문수"]
0 3
1 1
2 4
3 2
Name: 주문수, dtype: int64
- 알아두기
- dataframe 에서 특정 컬럼을 가져오면, Name, dtype 정보도 출력됨
- Name 은 컬럼명, dtype 은 데이터를 구성하고 있는 데이터의 타입
- 데이터 타입은
pandas.core.series.Series
으로 불러와짐
컬럼(Column) 추가
📍맨 마지막에 컬럼 추가
df["새로추가할 컬럼명"] = value 값 넣기
df["픽업여부"] = "Y"
df["총매출"] = df["주문수"] * df["판매가"]
df
주문수 판매가 픽업여부 총매출
0 3 500 Y 1500
1 1 1000 Y 1000
2 4 2000 Y 8000
3 2 5500 Y 11000
📍원하는 위치에 컬럼 추가(insert)
df.insert(위치, 컬럼명, 컬럼값)
df.insert(1, "단골여부", ["N", "Y", "Y", "N"])
df
주문수 단골여부 판매가 픽업여부 총매출
0 3 N 500 Y 1500
1 1 Y 1000 Y 1000
2 4 Y 2000 Y 8000
3 2 N 5500 Y 11000
- 알아두기
insert
에서, 위치값은 int로 넣기
insert
는 변수에 다시 할당하지 않아도 됨
- 컬럼 위치는 앞에서 부터 0으로 시작 함
컬럼(Column) 삭제
📍del
del df["컬럼명"]
del df["주문수"]
df
단골여부 판매가 픽업여부 총매출
0 N 500 Y 1500
1 Y 1000 Y 1000
2 Y 2000 Y 8000
3 N 5500 Y 11000
📍pop
df.pop("컬럼명")
df.pop("픽업여부")
df
단골여부 판매가 총매출
0 N 500 1500
1 Y 1000 1000
2 Y 2000 8000
3 N 5500 11000
- 알아두기
pop
는 del
과 동일하게 변수에 다시 할당하지 않아도 됨
📍drop
df = df.drop(labels="컬럼명", axis=0또는1)
df = df.drop(labels="단골여부", axis=1)
df
판매가 총매출
0 500 1500
1 1000 1000
2 2000 8000
3 5500 11000
df = df.drop(labels=0, axis=0)
df
판매가 총매출
1 1000 1000
2 2000 8000
3 5500 11000
- 알아두기
drop
는 del
, pop
과 다르게 변수에 다시 할당해주어야 저장이 됨
axis
= 0 : 행을 기준, axis = 1
: 열을 기준
참고문헌