1-3. SVD Application

Bard·2023년 3월 14일

AI K-MOOC Linear Algebra math

Advanced Mathematics for AI

목록 보기

3/20

본 글은 K-MOOC의 인공지능 수학 고급(Advanced Mathematics for AI) 강의를 듣고 요약한 글입니다.

Question

1-1. Data representation 에서 봤던 데이터를 다시 가져오자.

$d_1$ : Romeo and Juliet
$d_2$ : Juliet O happy dagger
$d_3$ : Romeo died by dagger
$d_4$ : Live free or die that is the New-Hampshire's motto
$d_5$ : Did you know New-Hampshire is in New-England

자, 여기에서 die와 dagger에 관련된 문서를 찾으라는 문제가 나왔다면 어떻게 접근할 수 있을까?

$d_2$ , $d_3$ , $d_4$ 은 제목에 단어들이 있다. 아마 연관성이 있을 것이다.
$d_5$ 는 아무 단어도 없다. 그리고 연관성도 없다.
$d_1$ 은 아무 단어도 없다. 하지만..? 사실 로미오와 줄리엣은 die와 dagger와 연관이 있는 소설의 제목이다.

이러한 숨은 의미를 발견할 수 있을까?

Solution: Latent Semantic Indexing

우리는 문서들에 숨은 의미를 찾아내야 한다.

1-1. Data representation 에서 만들었던 행렬을 다시 가져오자.

	romeo	juliet	happy	dagger	live	die	free	New-Hampshire
$d_1$	1	1	0	0	0	0	0	0
$d_2$	0	1	1	1	0	0	0	0
$d_3$	1	0	0	1	0	1	0	0
$d_4$	0	0	0	0	1	1	1	1
$d_5$	0	0	0	0	0	0	0	1

이 행렬을 분해하여 숨은 의미를 찾을 수 있지 않을까?

우리는 1-2. Matrix Decomposition 에서 여러 분해 기법을 살펴보았고, 해당 행렬은 정사각행렬이 아니기 때문에 마지막으로 다룬 SVD가 가능해보인다.

잠깐 SVD에 대해서 짚고 넘어가자.
주어진 행렬 $A_{M\times N}$ 를 $A_{M\times N} = U_{M\times M}\Sigma_{M\times N}{V_{N\times N}}^T$ 로 분해하는 것을 full SVD라고 부른다.
실제로 이와같이 full SVD를 하는 경우는 드물며 아래 그림들과 같이 reduced SVD를 하는게 일반적이다.

thin SVD

compact SVD

truncated SVD