본 글은 K-MOOC의 인공지능 수학 고급(Advanced Mathematics for AI) 강의를 듣고 요약한 글입니다.
다음과 같은 문서가 있다. 이를 어떻게 우리가 쓰기 쉽게 표현할 수 있을까?
: Romeo
and Juliet
: Juliet
O happy
dagger
: Romeo
die
d by dagger
: Live
free
or die
that is the New-Hampshire
's motto
: Did you know New-Hampshire
is in New-England
답은 다음과 같은 행렬을 만드는 것이다.
행
: 문서
열
: 단어
: 번째 단어가 번째 문서에 등장한 횟수
romeo | juliet | happy | dagger | live | die | free | New-Hampshire | |
---|---|---|---|---|---|---|---|---|
1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | |
0 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | |
1 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | |
0 | 0 | 0 | 0 | 1 | 1 | 1 | 1 | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
앞으로 우리는 이러한 데이터들을 다룰 것이다.
데이터는 행렬(matrix) 또는 다차원 배열(multidimensional array)로 표현될 것이며 그 말인즉슨 tensor의 형태로 나타나게 될 것이라는 것이다.
인공지능 수학..wow.. 앞으로 기대하겠습니다..