220425_TIL

홍성현·2022년 4월 25일
0

TIL

목록 보기
4/7
post-thumbnail

오늘 한 일

☘️ Algortihm

☘️ ML

  • missing data
  • 중복된 값 삭제하기
  • outlier(z1score, IQR)
  • data 정규화

☘️ DL

  • 퍼셉트론은 무엇인가? 훑어보는 시간.

느낀점

  • ML에서 data는 중요하다. 결측값, 중복된 값 삭제, outlier을 판단하여 데이터를 가공하는 것은 중요하다.
  • 정규화를 할 때 traning set과 test set을 분리해서 fit_transform, transform 해줘야한다. model이 data를 학습하면 정확도를 알 수가 없기에 training set은 fit_transform으로 해줘야하고 이후에 parameter를 통하여 test data의 feature을 scale해준다.
    transform 참고
  • python 라이브러리를 사용해서 ML을 배우고 있는데 라이브러리 사용이 익숙하지가않다. 왜 이렇게 나올까 의아할때가 많다. 처음 봤을 때보다는 많이 나아졌고 시간이 지나고 관련 프로젝트를 하면 나아질 것이라고 생각한다.
profile
softwareEngineer

0개의 댓글