결측 데이터 찾기, 필터링

코딩다시시작·2024년 11월 4일

빅데이터분석

목록 보기
14/19

기존 데이터 프레임

결측치가 있는 데이터 찾고 필터링

method1 isnull을 조건으로

cond = df['f1'].isnull()
df = df[cond]
  • cond를 통해, df의 'f1'에 NaN값을 가진 행만 선택
  • df = df[cond]로 하면, df['f1'] 값이 다 NaN이 됨

out:

method2: isnull() 간단하게

df = df[df['f1'].isnull()]
  • method1과 마찬가지로 isnull을 이용하지만, 한번에 진행

method3: query() 메서드 사용

df = df.query('f1 != f1')
  • NaN 값은 자기 자신과 같지 않는 특성을 가지므로, f1 != f1조건으로 결측값 필터링 가능

method4: loc과 isnull() 함께 사용

df = df.loc[df['f1'].isnull()]
  • df.loc[행선택, 열선택]으로 특정 행과 열을 기반으로 선택할 때 사용
    df = df.loc[df['f1'].isnull()]는 결측값 있는 행만 선택
profile
gpt로 다시 배우는 개발

0개의 댓글