03강. 전통적인 머신러닝 VS 딥러닝(2) <머신러닝 관련 수학 강의, 도움되는 강의 링크!!>

이찬·2023년 9월 14일

딥러닝

Feature Engineering

넓은 의미의 feature : 데이터 자체의 특징
좁은 의미의 feature : data의 하나의 column
feature selection / extraction
one/hot encoding, min-max scaling...

딥러닝에서는 컴퓨터가 대신 전처리를 해줌
결측치 처리, 이상치 제거... 정도는 인간이 해주어야 함

전통적인 머신러닝 : hyper parameter 설정이 필요, 여러 실험을 통해 hyper parameter 수정이 가능, feature importance를 통해서도 수정 가능

딥러닝 : 코드에 data를 넣어주면 됨, model tuning 시 문제가 되는 부분이 확실하지 않음

장점

선입견이 배제된다.
손이 덜 들어간다.

단점

data가 많이 필요하다. => 정답까지 있는 data가 많이 필요하다.
데이터의 양을 뻥튀기 가능 => data augmentation 데이터 증강
왜 그런 예측을 했는가에 대한 투명한 이해, 설명이 어려움

머신러닝 : permutation importance (열을 1개 뒤섞었을 때 정확도의 차이)
permutation : 순열

딥러닝 : Lime

딥러닝 모델이 본래 정형 data였던 data를 대상으로는 전통적인 머신러닝 보다는 성능이 떨어짐 => 정형 데이터를 위한 TabNet