<NAVER boostcourse>
에서 수강한 강의를 바탕으로 정리한 내용입니다.= panel data
series.index
: 인덱스값 접근 series.value
: 시리즈값 접근series.name
: 시리즈 이름, dataframe에서 추출된 series일 경우 column 명에 해당됨astype()
함수를 이용해 value 타입을 변경할 수 있음matrix를 다루는 객체임
row, column으로 구성되어 있음
dataframe에서 column 선택 = series 추출
index method
.loc
: 인덱스 이름 사용
.iloc
: 인덱스 번호 사용
i | col1 | col2 |
---|---|---|
0 | 'a' | 28 |
3 | 'b' | 20 |
4 | 'c' | 15 |
5 | 'd' | 9 |
df.iloc[3,0] = 'd'
df.loc[3,0] = 'b'
numpy와 마찬가지로 boolean index
, fancy index
사용 가능 (series도 사용 가능)
reset_index
: index를 reset한 df 반환함, 기존 인덱스는 새로운 column으로 들어감
**inplace 옵션을 true로 설정해주면 원본 df에도 적용됨
**drop 옵션을 true로 설정해주면 column으로 들어간 기존 인덱스를 삭제하여 df를 반환함
delete method
del
: 데이터프레임 원본의 row, col 삭제, 할당된 메모리도 삭제됨drop
: axis를 지정하여 row, col 삭제, 삭제한 df를 반환함 (원본은 유지됨)+-
와 같은 연산자로 연산하게 되면 모든 값이 NaN 값으로 채워짐df.add(series, axis=0)
과 같이 axis를 지정해줌으로써 row broadcasting을 수행할 수 있도록 함lambda
, map
, apply
함수로 df operation 수행