Mass Editing Memory in a Transformer
ICLR 2023
MLP 레이어의 주요 path 확인
단일한 linear associative memory(=single layer)에 batch update
여러 레이어 업데이트
파라미터 변화의 정도가 최소화될 때 강건성이 증가한다는 이전 연구를 바탕으로 update를 여러 레이어에 골고루 나누어 진행(spread evenly)
1) z_i 계산
2) z_i - h_i(L)를 레이어에 분할
전체 알고리즘
metrics
datasets