전처리 - pd.where 사용법

류소리·2023년 1월 6일
0

전처리

목록 보기
5/11

np.where vs pd.where

: 판다스 라이브러리의 where 함수는 넘파이의 np.where 함수와 사용법 및 용도가 꽤 유사하긴 합니다.
다만, np.where과 pd.where의 차이점은 np.where은 해당 원소 값 대신 위치를 가져온다는 점과 값이 True인 위치에도 대치할 값 지정이 가능하다는 점입니다.

np.where ('조건' ,True, False)

  • np.where(A>3 ,100 ,0)
    : A가 3 초과이면 100으로 표현, 3이하면 0으로 표시

  • np.where(tmp%2==0) # 배열 tmp에서 2의 배수인 원소의 index를 반환하는 배열을 생셩
  • np.where(tmp<7, tmp,1) # tmp의 원소가 7보다 작으면 tmp를 그대로 반환, 아니면 1을 반환

Series객체.where()함수

: Series객체1.where(Series객체에 대한 조건문, 거짓 값에 대한 대체 값)
df.where('조건',)


출처:
https://jimmy-ai.tistory.com/143
https://yganalyst.github.io/data_handling/memo_3/

profile
새싹 빅테이터 개발자

0개의 댓글