논문 리뷰 - Physics-Informed Attention Temporal Convolutional Network for EEG-Based Motor Imagery Classification

govlKH·2024년 7월 26일

논문리뷰

목록 보기

37/45

Physics-Informed Attention Temporal Convolutional Network for EEG-Based Motor Imagery Classification

1) 배경 및 목적

Brain Computer Interface 기반의 중요도에 비해, 복잡하고 많은 잡음이 존재하는 EEG데이터의 분석 및 예측 어려움이 존재

⇒ 본 논문의 ATCNet을 제시하며, 우수한 MI 분류 score를 기여

(MI 작업 종류: 왼손 상상 (1) / 오른손 상상 (2) / 양발 상상 (3) / 혀 상상 (4))

2) ATCNet model Architecture

본 모델은 세 가지 block으로 구성

① Convolutoin block ② Attention block ③ Temporal Convolution block

① Convolutoin block

여기서도 세 가지 종류로 분할

시간
2D conv로 (1xkc) (kc=Fs/4) (Fs는 샘플링 속도Hz) F1=16개 사용.

BatchNorm

채널
2D conv로 (Cx1) F1xD=16x2개 사용. (D=2 경험적)

BatchNorm + ELU
Average Pooling (1, 8)

공간
2D conv로 (1x16) F2=32개 사용. (F2=32 경험적)

BatchNorm + ELU
Average Pooling (1, P2=7)

뇌파의 시계열 분석에는 1D CNN이 용이하겠지만, EGG와 같이 공간 정보를 가져가기 위한 2D CNN 사용. (1D CNN에서 주로 사용하는 행을 Channel이라고 부른 것은 의아함이 항상 존재.)

⇒ 이 세 가지 layer를 통과하게 되면 그림과 같이 TCxF2 (20x32) 사이즈 feature가 완성
Q. 본 논문에서는 Average Pooling을 통한 각 8,7 사이즈를 통해 56 time point를 압축했다고 언급.
하지만 모델 앞 단의 시간 정보를 가져가기 위한 (1xkc) conv layer를 통해 receptive field 정보가 들어갔을 텐데? (이 부분은 미미함으로 무시했다고 생각하고 이해 )

⇒ 이후 Sliding Window를 통해 샘플링(데이터 증강) : 하나씩 밀어가며 취하는 것이 아닌 Conv layer를 통한 병렬화로 한 번에 작업.

② Attention block

transformer의 MSA과 동일하게 사용

앞의 CV block에서 나온 feature를 통해 Q,K,V를 만들어 사용

Residual connection 으로 identity shortcut을 통한 작업

forward pass
identity shortcut을 이용해 더해주었는데, 점화식을 이용하여 풀어보면 아래와 같이 쭉 나온다. 그렇게 되면 빨간 식과 같이 초기값과 F들의 합으로 표현이 가능하다.
backward pass
cost에 대한gradient를 계산하면(초기 xk까지), K로 분해했을 때 위의 forward때 식을 가져와 미분하여 아래와 같이 (1 - ~ )로 표현 가능