지도학습 - 데이터를 학습시킬 때, (train 데이터에) 라벨을 줌으로써 데이터를 학습시키는 것
비지도 학습 - 데이터를 학습시킬 때, (train 데이터에) 라벨을 주지 않고 학습시키는 것
=> 현재 반도체 데이터에서는 라벨을 주지 않고 학습을 시켰기 때문에 비지도 학습!
이진 분류는 2가지로 분류하는 기법을 의미
본 프로젝트에서는 train 데이터 label에 '0'(정상)밖에 없기 때문에 딥러닝 프로젝트의 반도체 데이터에서는 이진분류가 될 수 없음.
따라서 반도체 데이터로 이진분류 하기 위해서 반도체의 test 플도 내 비정상(1) 데이터를 oversamplling 후, train, val, test로 나눠 진행할 예정
분류 문제를 다룰 때 특정 클래스의 데이터가 다른 클래스에 비해 상당히 적을 때 그 불균형을 해결하기 위한 방법 중 하나에요. 데이터를 인위적으로 늘리는 것
뭘 집어 넣어도 된다라고 가정하면, 오터인코더에 내가 하려는 이미지 자체를 적어도 넣어도 되고
특성 추출한 이미지의 특성을 넣어도 됨.
따라서 오터인코더만 넣어도 되고 오토인코더를 학습시킬(특성 피처)를 넣어도 됨.
학습을 시켰을 대 정상 이미지로 학습시키면 정상 이미지와 오차가 얼마나 나는지 알려주는 것
이대 정상과 학습시킬? 이미지의 오차가 얼마로 설정하는지가 중요함!
clf -> 분류기