Basic-Pandas 2회차 [40일차]

차현빈·2025년 12월 12일

1. 판다스 주요 함수 정리

내가 낯선 개념 위주로 정리함

1. quantile - 4분위수 확인

df['petal_width'].quantile([0.25, 0.75])

2. 숫자들만 계산하기

그냥 median을 쓰면

species가 int 아니기에 계산이 안 됨

이럴 때 numeric_only = True를 넣어주면 숫자들만 계산한다.

max는 예외

3. dropna - 결측값 제거

axis는 행열 선택이고, how에서 any는 하나라도 있으면 True이고 all은 다 있으면 True로 반환

4. df.fillna(0) - 결측치를 0으로 채움

괄호 안에 값으로 채워줌 최댓값 찾으려면 밑에처럼

여기서부터 조금 어려워짐

5. lambda

df = df.assign(ln_A=lambda x: np.log(x.A)).head()
  • df.assign(): 원본 DataFrame에 새 열을 추가합니다. (함수임)
  • ln_A(칼럼 이름)
  • lambda x: np.log(x.A): 각 행(x)의 A 값에 자연로그를 계산해 ln_A 열에 지정 (식)

6. qcut

pd.qcut(df.B, 2, labels=["bad", "good"])
  • B 열을 2가지로 나눔 (하위 50%, 상위 50%)로 구간화

다른 예시로 4구간으로 나눌 수도 있음

7. clip - 범위 대체

df['B'].clip(lower=1, upper=3)
  • B 열의 값을 1보다(lower) 작으면 1로, 3보다 크면(upper) 3으로 각각 대체하여 범위를 지정
  • lower=1과 upper=3 인수를 사용해 하한과 상한을 설정

0개의 댓글