df["원하는 칼럼"] = df["원하는 칼럼"].fillna(원하는 값) # 새로운 변수에 할당 안 하고 inplace = True를 사용할 수 있다 # if 특정 칼럼의 통계값을 넣고 싶은 경우 height_mean = df["키"].mean() df["키"].fillna(height_mean)
1. df.dropna() # 빈 값이 있는 행을 모두 제거하기 2. df.dropna(axis=0) # 빈 값이 있는 경우에 행을 제거해준다 3. df.dropna(axis=1) # 빈 값이 있는 경우에 열을 제거해준다 4. df.dropna(axis=0, how='any') # 빈 값이 1개라도 있는 경우에 행을 제거해준다 # 4번 == 2번 5. df.dropna(axis=0, how='all') # 빈 값이 모두 없는 경우에 행을 제거해준다
기본적으로 처음에 나온 값은 유지되고 그 뒤에 나온 값이 삭제된다.
1. df["원하는 칼럼명"].drop_duplicates() 2. df["원하는 칼럼명"].drop_duplicates(keep = "first") # 1번 == 2번 3. df["원하는 칼럼명"].drop_duplicates(keep = "last") 4. df.drop_duplicates("원하는 행") # 원하는 행에서 겹치는 값을 모두 제거시켜준다.
df.drop("원하는 칼럼", axis=1) df.drop(["원하는 칼럼1", "원하는 칼럼2"], axis=1)
df.drop("원하는 인덱스 번호", axis=0) df.drop(["원하는 인덱스 번호1", "원하는 인덱스 번호2"], axis=0)
정리하자면
이게 가끔 헷갈릴 때가 있으니까 주의하자.