“나는 사과를 먹었다”
토큰1: 나는 토큰2: 사과를 토큰3: 먹었다
Q(Query): 나는 지금 무엇을 찾고 있지? K(Key): 나는 어떤 특징을 가지고 있지? V(Value): 내가 실제로 전달할 정보는 뭐지?
“먹었다”의 Q: 먹은 대상이 뭔지 찾고 싶음 “사과를”의 K: 먹을 수 있는 대상 정보가 있음 그래서 “먹었다”가 “사과를”를 강하게 참고함