데이터 구축 Null값

김현지·2022년 10월 30일
0

데이터 구축(널값 처리)

#넘파이 import
#판다스 import
import pandas as pd
import numpy as np

#리스트 만들기
data = [1, np.nan, ' hello', None]
#시리즈 만들기
s = pd.Series(data)
s.isnull() #널값이 값에 true를 리턴
s.isna()#그냥 널값을 체크
s.notnull()#널값이 아닌 값에 true를 리턴
s[s.isna()]#널값인것만 출력
s[s.notnull()]#널값이 아닌것만 출력
s.isna().sum()#컬럼별로 널값을 체크할 때
#널값 버리기
s.dropna(inplace=True) #저장 할 때 inplace 사용 
s = s.dropna() #결과 저장시 사용 둘중에 하나 사용하기


#데이터 프레임 만들기 list []로
data = [[1,np.nan,2],[2,3,5],[np.nan,4,6]]
df = pd.DataFrame(data)
df.dropna()#행에 널값이 하나라도 있으면 드랍
#설문조사에 응답 안한 사람의 수 없애기 
df.dropna(axis=1)#방향이 바뀐것의 널값 드랍하기
df.dropna(how='all')#컬럼 전부 응답 안할 때 #전체가 널값인 행을 삭제
df['3']  = np.nan #새로운 컬럼 넣기 #널값인 열을 추가
df.dropna(axis=1,how='all') #전체가 널값인 열을 삭제 #한컬럼에 전체 null값 지정하기
profile
안녕하세요! 오늘도 모두 좋은 하루 보내세요!

0개의 댓글