# Truncated SVD

SVD(Singular Value Decomposition)
LSA(Latent Semantic Analysis), 잠재 의미 분석이란 기본적으로 단어의 빈도 수를 이용한 수치화 방법입니다. 이 알고리즘의 근원은 따지고 보면 NLP입니다. BoW에 기반한 DTM이나 TF-IDF는 기본적으로 단어의 빈도 수를 이용한 수치화 방법이기 때문에 단어의 의미를 고려하지 못한다는 단점이 있었고, 이를 위한 대안으로 LSA라는 방법이 나왔습니다. 미션은 SVD인데 왜 LSA 이야기를 하고 있냐구요? LSA를 이해하기 위해서는 SVD에 대해 잘 알아야 하기 때문입니다. Latent (잠재된) 의미를 제대로 이끌어내기 위해서는, 나름대로의 이 필요합니다. 그리고 이때, Truncated SVD가 사용됩니다. 이를 사용함으로써 기존의 행렬에서는 드러나지 않았던 심층적인 의미를 확인할 수 있게 되죠. 여기서부터 문제입니다. [SVD와 Truncated SVD]의 개념을 공부하고, 두 개의 차이에 대해 서술하세요. 대체 어떤 방식으로 차원

[밑바닥부터 시작하는 딥러닝2] 05. Word Embedding
자연어: 우리가 평소에 쓰는 말 자연어 처리(NLP; Natural Language Processing): 우리의 말을 컴퓨터에게 이해시키기 위한 분야 말은 문자로 구성되고, 문자는 단어로 구성된다. $\therefore$ NLP에서는 단어의 의미를 이해시키는 것이 중요함. 단어의 의미 표현 시소러스(유의어 사전) 인력을 동원해 동의어, 유의어 그룹 별로 분류 NLP에서는 '상위와 하위', '전체와 부분' 등 더 세세한 관계까지 정의 단어 간의 관계 그래프로 표현하면 단어 사이의 관계 학습 가능(단어 네트워크) car = auto, automobile, machine, motocar object $\ni$ motor vehicle $\ni$ car, go-kart, truck WordNet: 유명한 시소러스 문제점 1. 시대 변화에 대응 어려움 2. 사람의 비용이 큼