'데이터 사이언스 입문' 2.DataFrame 다루기

인덱스·2023년 1월 6일
0

codeit

목록 보기
10/17

*2021. 7. 10. 23:28 에 작성한 글

다시 코드잇 집중이다!


DataFrame 인덱싱

DataFrame 인덱싱 문법 정리

이름으로 인덱싱하기기본 형태단축 형태
하나의 row 이름df.loc["row4"]
row 이름의 리스트df.loc[["row4", "row5", "row3"]]
row 이름의 리스트 슬라이싱df.loc["row2":"row5"]df["row2":"row5"]
하나의 column 이름df.loc[:, "col1"]df["col1"]
column 이름의 리스트df.loc[:, ["col4", "col6", "col3"]]df[["col4", "col6", "col3"]]
column 이름의 리스트 슬라이싱df.loc[:, "col2":"col5"]

위치로 인덱싱하기기본 형태단축 형태
하나의 row 위치df.iloc[8]
row 위치의 리스트df.iloc[[4, 5, 3]]
row 위치의 리스트 슬라이싱df.iloc[2:5]df[2:5]
하나의 column 위치df.iloc[:, 3]
column 위치의 리스트df.iloc[:, [3, 5, 6]]
column 위치의 리스트 슬라이싱df.iloc[:, 3:7]

데이터 변형하기

값 바꾸는 것이 이리도 간단한 일이었다니
row, column 별로 바꿀 수도 있고 여러 라인들을 한 번에 바꿀 수도 있고
위치 지정해서 원하는 값을 넣을 수도 있는 것이 이리도 간단한 일인가요

DataFrame에 값 추가/삭제

추가할 때는 loc
삭제할 때는 drop

*원본데이터 변경 포인트
1)원본도 같이 삭제 : inplace = True
2)원본은 그대로 : inplce = False

index/column 설정하기

.rename

.name.index

.set_index

큰 데이터 다루기

대용량의 데이터를 다룰 때 효율적인 방식으로 데이터 찾기

.head()
: 위에서부터 () 개의 파일만

.tail()
: 아래에서부터

.shape
: 데이터 프레임의 얼마나 큰지, 모양 파악 가능

.columns
: 컬럼 목록 파악

.info
: 컬럼들과 기본정보 파악

.describe
: 데이터 프레임의 통계 정보 파악

.sort_values(by = '')
: row들을 원하는 기준으로 정리

.sort_values(by = '', ascending=False)
: 오름차순

큰 series 살표보기

df['']
df[''].unique()
: 겹치는 것 없이

df[''].value_counts()
: 각 브랜드 별로 몇개씩 있는지

df[''].descrive()
: 시리즈에 대한 정보


본격 여름을 알리는 장마 덕분에
더위 먹고 뇌에 습기차는 기분으로 허덕이다가
에어컨 트니까 다시 일상 복구다...

미련없이 틀면 될 것을 왜 참았는지...!

다시 락다운급으로 살려니 막막하지만
여름캠프왔다고 생각하고 공부나 해야지ㅠㅠ

'데이터 사이언스 입문' 2.DataFrame 다루기|작성자 Index

profile
헤맨 만큼 내 땅이 된다

0개의 댓글