-
이전 연구에서 설명되었듯이, 잠재 개념은 언어가 무작위로 생성되지 않는다는 생각을 담고 있다.
-
즉, 인간이든 모델이든 언어를 생성할 때, 먼저 마음 속에서 아이디어나 의도가 형성된 후, 그 아이디어나 의도를 전달할 단어를 선택한다.
-
더 formal 하게는, Θ를 latent concept space라 하고, θ ∈ Θ를 concept라 설정한다면,
- Xie ek al. [2021]에 따르면, task x와 관련 답변 y는 먼저 latent concept θ ∈ Θ에서 벡터를 선택하고, 이후 (x,y) ~ D(θ)를 샘플링하여 생성된다.
- 여기서 D는 concept에서 task-answer pair로 매핑하는 distribution을 나타낸다.
-
유사하게, 모델이 응답을 제공할 때, x를 관찰하고, 잠재 개념 θ 또는 더 일반적으로 잠재 개념 공간에 대한 분포를 추론한 후, 추론한 개념에 따라 응답을 생성한다.
- 즉, 위에서 주어진 모델 생성 확률 수식은 아래와 같이 표현될 수 있다.

- 위 식은 잠재 개념 공간 Θ에 대해 항상 성립한다.
-
잠재 개념의 예시
- BoolQ 데이터셋에서의 QA task
- Q: “Abraham Lincoln이 영화 Saving Private Ryan에서 편지를 썼습니까?”
- A: “Yes”
- 이 경우, 잠재 개념은 영화의 한 장면, 즉 Lincoln이 쓴 Bixby letter가 병사들 앞에서 읽히는 장면과 관련있다.
- 본 연구 case와 마찬가지로, 먼저 concept θ가 선택되고, 이후 영화에서 문자열 x가 샘플링된다(즉 영화와 관련된 질문이 생성된다).
- 산술 계산, ex. 곱셈
- 언어로 곱셈은 “4 * 4” 와 같은 형식으로 작성 가능
- 이 문자열의 잠재 개념은 곱셈의 매커니즘을 나타낸다.
- 예를 들어, 곱셈은 덧셈의 반복이며, 덧셈은 숫자 값을 반복적으로 1씩 증가시키는 것
- 그러나 잠재 개념은 더 추상적일 수 있다
- 알려지지 않은 임베딩 공간의 벡터로 표현될 수 있다.