
<NAVER boostcourse> 에서 수강한 강의를 바탕으로 정리한 내용입니다.= panel data
series.index : 인덱스값 접근 series.value : 시리즈값 접근series.name : 시리즈 이름, dataframe에서 추출된 series일 경우 column 명에 해당됨astype() 함수를 이용해 value 타입을 변경할 수 있음matrix를 다루는 객체임
row, column으로 구성되어 있음
dataframe에서 column 선택 = series 추출
index method
.loc : 인덱스 이름 사용
.iloc : 인덱스 번호 사용
| i | col1 | col2 |
|---|---|---|
| 0 | 'a' | 28 |
| 3 | 'b' | 20 |
| 4 | 'c' | 15 |
| 5 | 'd' | 9 |
df.iloc[3,0] = 'd'
df.loc[3,0] = 'b'
numpy와 마찬가지로 boolean index, fancy index 사용 가능 (series도 사용 가능)
reset_index : index를 reset한 df 반환함, 기존 인덱스는 새로운 column으로 들어감
**inplace 옵션을 true로 설정해주면 원본 df에도 적용됨
**drop 옵션을 true로 설정해주면 column으로 들어간 기존 인덱스를 삭제하여 df를 반환함
delete method
del : 데이터프레임 원본의 row, col 삭제, 할당된 메모리도 삭제됨drop : axis를 지정하여 row, col 삭제, 삭제한 df를 반환함 (원본은 유지됨)+- 와 같은 연산자로 연산하게 되면 모든 값이 NaN 값으로 채워짐df.add(series, axis=0) 과 같이 axis를 지정해줌으로써 row broadcasting을 수행할 수 있도록 함lambda, map, apply 함수로 df operation 수행