입력과 출력이 같은 구조로 단순히 입력과 출력이 같은 신경망
Encoding
Dedoding
오토인코더의 가장 중요한 기능 중 하나는 매니폴드를 학습하는 것
고차원 데이터가 있을 때 고차원 데이터를 데이터 공간에 뿌리면 샘플들을 잘 아우르는 subspace가 있을 것이라는 가정에서 학습을 진행하는 방법
따라서, 비슷한 특징을 가지는 데이터로 이루어진 클래스는 특징 추출을 통해서 데이터 축소가 가능하다.
데이터 압축
데이터 시각화
차원의 저주 피하기
유요한 특징 추출
매니폴딩을 잘 학습하게 되면 데이터를 시각적으로 표현하는데 쉬워진다.
데이터에 대한 직관을 얻거나 결과물에 대한 해석이 쉬워짐
데이터의 차원이 증가할 수록 해당 공간의 크기가 기하급수적으로 증가
동일한 개수의 데이터의 밀도는 차원이 증가할 수록 급속도로 희박 따라서, 차원이 증가할 수록 데이터의 분포 분석 또는 모델 추정에 필요한 샘플 데이터의 개수가 기하급수적으로 증가⬆️
가장 대표적인 차원 축소 알고리즘으로 주성분을 분석하는 방법
데이터에 가장 가까운 초평면을 구한 다음 해당 데이터를 초평면에 투영
입력과 출력의 크기가 같음
입력 == 출력 => 비교사 학습 문제로 바꾸어서 해결 가능
인코더 : 학습 데이터를 벡터로 표현
디코더 : 최소한 학습데이터는 생성
사람이 생각했을 때 같은 수준이라고 생각되는 정도의 노이즈만 추가
나온 결과 값들은 같은 매니폴드로 구분
데이터를 생성하는 것 !!