오토 인코더란? 언제가 적용되기 적합한 상황일까?

Aurora·2025년 12월 31일

AI

목록 보기
16/25

목차

오토인코더란?

입력 데이터를 그대로 출력으로 복원하도록 학습하는 신경망 모델

오토인코더는 레이블(정답) 없이 입력 데이터 자체를 학습 신호로 사용한다.
데이터의 핵심 특징을 압축된 잠재 표현(latent representation)으로 학습하는 것이 목적이다.
즉, 입력 → 압축 → 복원 구조인 것이다.

“데이터를 잘 복원할 수 있도록” 학습하고,
실제 활용 가치는 중간의 압축된 표현(잠재 표현)에 있다.

오토인코더의 구성요소

오토인코더는 크게 두 개의 핵심 구성요소로 이루어진다.

오토인코더는

입력 x를 받아서
→ Encoder를 통해
→ 잠재 표현 z를 만들고
→ 이를 Decoder를 통해
→ 복원을 한 유사 x'를 내보낸다.

이 과정에서 인코더와 디코더가 핵심이다.

인코더는 입력을 저차원 표현으로 압축하고,
디코더는 압축된 표현을 다시 원래 형태로 복원한다.

입력과 출력이 최대한 비슷해야하기 때문에, 오토인코더의 학습은 입력 데이터와 복원된 출력 데이터간의 재구성 오차(Reconstruction Error)를 최소화하는 방식으로 진행된다.

인코더와 디코더 각각의 차이점

구분인코더 (Encoder)디코더 (Decoder)
주 역할정보 압축정보 복원
입력원본 데이터 x잠재 벡터 z
출력잠재 표현 z복원 데이터 x'
차원 변화감소증가
학습 관점원본 데이터의 핵심 특징 학습압축된 정보로 원본을 재구성하는 능력 학습

오토인코더가 적용되기 적합한 상황

오토인코더는 입력 데이터를 스스로 복원하도록 학습하기 때문에 데이터 자체에 내재된 특징을 효과적으로 학습할 수 있다.

따라서

  1. 고차원 데이터를 저차원의 잠재 공간으로 압축해야 할 때처럼 “차원 축소가 필요한 경우”
  2. 데이터로부터 자동으로 특징을 학습하고자 할 때처럼 “특징 추출 및 표현 학습이 필요한 경우”
  3. 정상 데이터는 잘 복원되지만 이상 데이터는 복원 오차가 커지도록 “정상 데이터만 충분히 존재하고 이상 데이터는 드문 경우” (이상 탐지)
  4. 노이즈가 섞인 이미지 복원이나 음성 잡음 제거처럼 “입력 데이터에 노이즈가 포함되어 있고, 이를 제거한 결과가 필요한 경우” (노이즈 제거)
  5. 이미지 압축과 같은 예시로 저장 공간 또는 전송 비용을 줄여야 할 때처럼 “데이터 압축 및 복원이 필요한 경우”

등에 사용한다.

profile
개발에 애정을 쏟는 연구자입니다

0개의 댓글