[Paper Review] Diff-E: Diffusion-based Learning for Decoding Imagined Speech EEG

강현구·2024년 8월 22일

Paper Review

목록 보기
13/20

Diff-E: Diffusion-based Learning for Decoding Imagined Speech EEG

1. Background

최근 연구 동향

  • 현재 딥러닝을 활용하여 EEG Decoding 연구가 활발히 진행중
  • 특히 노이즈로부터 원본을 복원하는 DDPM이 각광받고 있음

기존 EEG Decoding 연구의 한계

  • EEG 데이터는 SNR이 낮고(잡음이 많음), Variation이 크다는(사람마다 편차가 큼) 문제가 있음
  • DeepConvNet, EEGNet 모두 낮은 정확도를 보임

Diff-E 제안

  • (학습 성능) DDPM + CAE를 활용하여 EEG 신호의 복잡한 패턴을 효과적으로 학습

2. Dataset

  • imagined speech classification Task
  • Label : “ambulance”, “clock”, “hello”, “help me”, “light”, “pain”, “stop”, “thank you”, “toilet”, “TV”, “water”, “yes”, "rest" 까지 발화한 텍스트와 13Class Label이 있음
  • 10-10system의 64채널 데이터 사용하였으며, Reference 채널로 FCz, FPz 사용

Pre-Processing

  • 0.5~125Hz Bandpass Filtering 적용하였으며, 60Hz, 120Hz에서 전력선 간섭 제거를 목적으로 notch filter를 적용하였음
  • 표준 Re-Reference 수행
    • 각 채널 - 모든채널의 평균값
  • Artifact 제거 - ICA (EOG, EKG, 잡음 등)
  • High-Gamma Frequency Band 선택 (고주파 감마파 영역)
  • 2초 단위로 Epoching 하였으며, 500ms에 대해 Baseline Correlation 수행

3. Architecture

모델 구조

  • DDPM, CAE Encoder, CAE Decoder 모두 Conv1D+GN+ELU 의 Block으로 U-Net 아키텍쳐로 구성하였음

4. Result

  • SNR이 높아서 Representation을 뽑기 매우 어려운 EEG 데이터이고, Spoken Data가 아니라 Imagined Data임에도 불구하고 13 Class Classification Task에서 60%에 육박하는 성능이면 정말 좋은 성능임
  • (여담) 필자는 BCI Competetion Motor Imaginary 4 Class Clasification 데이터셋을 갖고 놀때 EEGNet으로 갖고 놀았을때 최대 65까지 나왔던것 같다... (똑같이 Imagined Dataset인데 4Class가 65밖에 못나왔었다..)
profile
고려대학교 인공지능학과 SLP Lab 석사과정생

0개의 댓글