입력 데이터를 그대로 출력으로 복원하도록 학습하는 신경망 모델
오토인코더는 레이블(정답) 없이 입력 데이터 자체를 학습 신호로 사용한다.
데이터의 핵심 특징을 압축된 잠재 표현(latent representation)으로 학습하는 것이 목적이다.
즉, 입력 → 압축 → 복원 구조인 것이다.
“데이터를 잘 복원할 수 있도록” 학습하고,
실제 활용 가치는 중간의 압축된 표현(잠재 표현)에 있다.
오토인코더는 크게 두 개의 핵심 구성요소로 이루어진다.
오토인코더는
입력 x를 받아서
→ Encoder를 통해
→ 잠재 표현 z를 만들고
→ 이를 Decoder를 통해
→ 복원을 한 유사 x'를 내보낸다.
이 과정에서 인코더와 디코더가 핵심이다.
인코더는 입력을 저차원 표현으로 압축하고,
디코더는 압축된 표현을 다시 원래 형태로 복원한다.
입력과 출력이 최대한 비슷해야하기 때문에, 오토인코더의 학습은 입력 데이터와 복원된 출력 데이터간의 재구성 오차(Reconstruction Error)를 최소화하는 방식으로 진행된다.
| 구분 | 인코더 (Encoder) | 디코더 (Decoder) |
|---|---|---|
| 주 역할 | 정보 압축 | 정보 복원 |
| 입력 | 원본 데이터 x | 잠재 벡터 z |
| 출력 | 잠재 표현 z | 복원 데이터 x' |
| 차원 변화 | 감소 | 증가 |
| 학습 관점 | 원본 데이터의 핵심 특징 학습 | 압축된 정보로 원본을 재구성하는 능력 학습 |
오토인코더는 입력 데이터를 스스로 복원하도록 학습하기 때문에 데이터 자체에 내재된 특징을 효과적으로 학습할 수 있다.
따라서
등에 사용한다.