240731 TIL #456 Pandas - 2

김춘복·2024년 7월 31일

TIL : Today I Learned

목록 보기

457/640

오늘은 pandas 이어서!

컬럼 1개만 선택 시 : .head(index) = Return the first n rows.
head()만 사용시 기본적으로 첫 5개를 보여준다.
컬럼 여러개 선택 시 : 리스트를 입력.
series를 따로 변수에 저장해 indexing해서 볼 수 있고, 부등호를 이용해서 필터링할 수 있다.
.drop(n) : index n의 행을 제외해서 보여준다.
여러 행을 제외하려면 리스트로 입력한다.
열을 제외할때는 axis=1을 추가한다.

series operation
index를 기준으로 연산을 수행한다.
겹치는 index가 없으면 NaN값을 반환한다.
dataframe operation
df에선 column과 index를 모두 고려해 연산을 수행한다.
+같은 연산자를 사용하면 겹치는 index만 계산하고 안겹치면 NaN을 반환한다.
하지만 .add()에 파라미터로 fill_value=기본값 을 설정하면 기본값을 넣어 계산해 준다.
사칙연산 add, sub, div, mul 다 사용가능하다.
dataframe + series
데이터프레임에 시리즈를 더할때는 연산자를 사용하지 않고
add, sub, div, mul에 파라미터로 axis=0처럼 기준값을 설정해주면 된다.

Full-Stack Dev / MLOps