[Generation] AutoEncoder

myeongwang·2024년 2월 26일
0

AutoEncoder

  • 입력 데이터의 패턴을 학습하여 데이터를 재건하는 모델
    • 비선형 차원 축소 기법으로 활용 가능
  • 오토인코더는 입력 데이터의 효율적인 표현을 학습하는 비지도 학습 모델
  • 일반적으로 인코더(encoder)와 디코더(decoder) 두 부분으로 구성
  • 인코더는 입력 데이터를 저차원의 잠재 공간(latent space)으로 압축하여 표현
  • 디코더는 잠재 공간의 표현을 다시 원본 데이터로 복원합니다.
  • 학습 과정에서는 입력 데이터와 디코더의 출력 간의 재구성 오차를 최소화하도록 모델을 학습시킵니다.
  • 주로 데이터 압축, 잠재 공간의 특징 추출, 차원 축소 등의 용도로 사용

구조

  • 인코더(Encoder): 데이터를 저차원 잠재 표현으로 요약

  • 디코더(Decoder): 저차원 잠재 표현으로부터 데이터를 재구성(Reconstruction)

학습

  • 손실 함수: 잠재 표현으로부터 복구한 데이터와 입력 데이터의 평균제곱오차(MSE)

Denoising AutoEncoder

  • 입력 데이터에 랜덤 노이즈를 주입하거나 Dropout 레이어를 적용
  • 노이즈가 없는 원래 데이터로 재구성
  • 디노이징 오토인코더는 노이즈가 있는 입력 데이터에서 원본 데이터를 복원
  • 일반적으로 입력 데이터에 노이즈를 추가한 후, 오리지널(clean) 데이터를 복원하도록 모델을 학습
  • 학습 과정에서는 노이즈가 추가된 입력 데이터와 오리지널 데이터 간의 차이를 최소화하도록 모델을 학습
  • 이렇게 함으로써, 모델은 입력 데이터의 노이즈를 제거하고 오리지널 데이터를 복원하는 능력을 학습
  • 주로 데이터의 노이즈 제거, 잡음이 있는 데이터의 표현 학습 등에 사용

오토 인코더의 활용

특징 추출기로의 활용

  • 학습한 오토 인코더의 인코더 부분을 특징 추출기로 활용
  • 잠재 벡터로부터 분류, 클러스터링 문제 해결

이상치 탐지 (Anomaly Detection)

  • 이상치는 재구성 했을 때 평균제곱오차가 크게 나올 것!
  • 특정 임계값을 넘으면 이상치로 판단
profile
Real Cryptocurrency Trader & AI Engineer LV.0

0개의 댓글