1-1. Data Representation

Bard·2023년 3월 13일
6
post-thumbnail

본 글은 K-MOOC의 인공지능 수학 고급(Advanced Mathematics for AI) 강의를 듣고 요약한 글입니다.

Question

다음과 같은 문서가 있다. 이를 어떻게 우리가 쓰기 쉽게 표현할 수 있을까?

d1d_1: Romeo and Juliet
d2d_2: Juliet O happy dagger
d3d_3: Romeo died by dagger
d4d_4: Live free or die that is the New-Hampshire's motto
d5d_5: Did you know New-Hampshire is in New-England

Answer

답은 다음과 같은 행렬을 만드는 것이다.
: 문서
: 단어
AijA_{ij}: jj번째 단어가 ii번째 문서에 등장한 횟수

romeojuliethappydaggerlivediefreeNew-Hampshire
d1d_111000000
d2d_201110000
d3d_310010100
d4d_400001111
d5d_500000001

앞으로 우리는 이러한 데이터들을 다룰 것이다.

데이터는 행렬(matrix) 또는 다차원 배열(multidimensional array)로 표현될 것이며 그 말인즉슨 tensor의 형태로 나타나게 될 것이라는 것이다.

profile
The Wandering Caretaker

2개의 댓글

comment-user-thumbnail
2023년 3월 13일

인공지능 수학..wow.. 앞으로 기대하겠습니다..

1개의 답글