오늘 한 일
☘️ Algortihm
☘️ ML
- missing data
- 중복된 값 삭제하기
- outlier(z1score, IQR)
- data 정규화
☘️ DL
느낀점
- ML에서 data는 중요하다. 결측값, 중복된 값 삭제, outlier을 판단하여 데이터를 가공하는 것은 중요하다.
- 정규화를 할 때 traning set과 test set을 분리해서 fit_transform, transform 해줘야한다. model이 data를 학습하면 정확도를 알 수가 없기에 training set은 fit_transform으로 해줘야하고 이후에 parameter를 통하여 test data의 feature을 scale해준다.
transform 참고
- python 라이브러리를 사용해서 ML을 배우고 있는데 라이브러리 사용이 익숙하지가않다. 왜 이렇게 나올까 의아할때가 많다. 처음 봤을 때보다는 많이 나아졌고 시간이 지나고 관련 프로젝트를 하면 나아질 것이라고 생각한다.