(시각화를 위해서 모델 학습 과정을 끝내고 파일로 저장되어 있어야 함)
eng_w2v_metadata.tsv와 eng_w2v_tensor.tsv (벡터의 수치정보를 담고 있음) 를 생성한다.
tsv : Tab Seperated Values
eng_w2v_tensor.tsv : 단어별로 임베딩 벡터를 탭으로 구분한 파일
eng_w2v_metadata.tsv : eng_w2v_tensor.tsv 에서 각 벡터가 어떤 단어를 나타내는지 나타내는 파일
PCA : 고차원의 데이터를 저차원의 데이터로 환원시키는 기법 (복잡한 데이터를 차원을 축소하여 시각화)
https://colab.research.google.com/drive/1ge0MnvvCW6Vzpvx4mo-YIb8JjdTztV7F#scrollTo=8i35bE6F405f
(임베딩이 잘 됐을 때) 단어 벡터들의 평균만으로 텍스트 분류를 할 수 있음을 입증
https://colab.research.google.com/drive/12O5pCl3Sb2btXGktFRkuoWjmtrJ-swop#scrollTo=whfSr8uUG89I