자세한 내용은 논문을 참고하세요. Attention is all you need : https://arxiv.org/pdf/1706.03762.pdf
일반적으로 단어의 개수만큼 행의 크기를 가지고, column data는 embedding dimension과 같은 data가 담긴 matrix를 사용하게 된다.
dimension은 지정할 수 있지만 일반적으로 512를 사용한다.
순서 정보를 포함하지 않았다.