[TIL] #1.1.2 Feature Engineering

Bella·2021년 3월 5일
0

TIL

목록 보기
2/11

Pandas

데이터 추출

.iloc[행, 열]

  • 위치 정수 기반으로 데이터 접근

.loc[행, 열]

  • 레이블 기반으로 데이터 접근

숫자 자리 구분 ',' 없애기

.read_csv(thousand = ',')

.replace(',', '')

형 변환

.astype('형')

.to_numeric(값)

결측치 처리

.fillna(0)

  • 0으로 채우기

.fillna(method = 'ffill' or 'pad')

  • 앞 방향으로 채우기

.fillna(method = 'bfill' or 'backfill)

  • 뒷 방향으로 채우기

NA, Null, NaN, 0, Undefined 차이점

NA : 정해지지 않은 값
Null : 아무런 값도 가지지 않는 특수한 값 (초기화 된 상태)
NaN : 정해지지 않은 값
0 : 0
Undefined : 선언은 되었으나 값이 할당 되지 않은 상태 (초기화 되지 않은 상태)

profile
Here Today, Gone Tomorrow

0개의 댓글