원본 논문의 경우 embedding dimension = 512로 설정하였고, 만일 h = 8인 경우 Q, K, V는 각각 512/8 = 64의 차원을 가지게 된다.
출처 : https://www.youtube.com/watch?v=AA621UofTUA