data cleaning 관련
a process of extracting useful features from raw data using math, statistics and domain knowledge
ex) Outlier Detection, Handling missing values, One Hot Encoding
** standard deviation(표준편차)
Nan값을 다른 값들의 평균값으로 채우기 etc...
text value를 Numerical value로 변환
기존의 Feature들을 조합, 이해하기 쉬운(분석하기쉬운) New Feature를 만들어내는것
DataFrame의 형태
Row(행)
하나의 데이터 or observation
Column(열)
하나의 feature
means 0/0 -- Stands for Not a Number
pandas에서 결측치를 표현하는 방법
type : float
결측치, 존재하지 않음
값이 없음
값이 없음
undefined는 변수를 선언만 하더라도 할당되지만 null은 변수를 선언한 후에 null로 값을 바꾼다
(출처: https://webclub.tistory.com/1)
type : int or float