-
힐버트 공간 Hilbert space
- 내적이 정의된 완비(모든 코시수열이 수렴한다)공간을 힐버트 공간이라고 부른다
- 대부분의 AI 이론이 전개되는 실수공간,복소수공간 Rn , Cn 이 힐버트 공간이다
- AI에선 두 대상간의 유사도 similarity를 측정하고자 하는데, 이에 가장 자주 활용되는 것이 바로 내적 inner product을 활용한 코사인 유사도이다. ( CS(A,B)=∥A∥∥B∥⟨A,B⟩ )
- 코시 수열 cachy sequence
- 수열이 진행될수록 두 원소 값이 점점 가까워 지는 수열
- 임의의 ϵ>0 에 대해, 적당한 자연수 N이 존재하여 m,n>N 일때 ∥xm−xn∥<ϵ 인 수열이다
- 코시수열의 특징
- 수렴하는 수열은 코시 수열이다
- Rn 에서의 코시 수열은 유계이다
- Rn 에서의 코시 수열은 수렴한다
-
Lp 공간
- Lp 공간이란 Normed Vector space(Norm이 정의된 vector space)의 한종류이다. 이때 p=2 인경우 Hilbert Space가 된다
- 임의의 집합 X 에서 실수로 가는 함수 f:X→R 를 생각하자. 그리고 이중 다음 조건을 만족하는 함수 집합을 생각하자
- ∥f∥p=(∫X∣f(x)∣pdx)p1<∞
- 위의 조건을 만족하고, 덧셈 (f+g)(x)=f(x)+g(x) , 스칼라곱(αf)(x)=αf(x) 이 정의된 함수들의 집합은 Vector space이다
-
커널 kernel (Ref) (함수해석학 내에서의 커널을 의미함)
- 조건
- 입력 공간 input space X=∅ 에서 힐베르트공간 (H,<⋅,⋅>) 로의 사상 ϕ:X→H 를 피쳐 사상 feature map(혹은 mapping function)이라 부르자. H를 피처 공간이라 부르기도 한다
- (H,<⋅,⋅>) 의 내적 ⟨⋅,⋅⟩:H×H→C 에 대하여 다음과 같이 정의된 함수 k:X×X→C 를 커널 Kernel이라고 정의한다
- 정의
- k(x1,x2)≡⟨ϕ(x1),ϕ(x2)⟩
- 커널의 역할
1. 입력 공간 X 가 어떠한 형태인지를 사전에 정의하지 않은 이유는, X 가 사진이나 문서데이터등의 다양한 형태가 올 수 있기 때문이다. 이 데이터들의 유사도를 측정하기 위해 우선 이 데이터들을 힐버트 공간의 벡터로 대응시키고(ϕ), 대응된 벡터들끼리 내적시키는 (⟨⋅,⋅⟩) 함수를 커널kernel이라 부르는 것이다
2. 또한 입력 공간 X 의 데이터 분포를 경계짓는 초평면이 선형적으로 존재하지 않는경우 (non-linear boundary), 데이터의 분류가 잘되는 고차원 공간 H 으로 옮겨 연산하기 위해 활용되기도 한다
- 양정부호 커널 positive definite kernel
- $m$ 개의 데이터 $\{ x _{1}, x _{2},\cdots,x _{m} \} \subset X$ 에 대하여, 다음과 같은 행렬 $K \in \mathbb{C} ^{m \times m}$ 을 커널 $k$ 의 그램 행렬 Gram Matrix라고 부른다
- $K \equiv (k(x _{i},x _{j}))_{ij}$
- $k$ 의 그램행렬이 positive semidefinite이면, $k$ 를 양의 정부호 커널이라고 부른다.
- 다시말해 $\{ c _{1},c _{2},\cdots,c _{m} \}\subset \mathbb{C}$ 에 대하여 다음을 만족하는 그램행렬을 갖는 커널 $k$ 를 양의 정부호 커널이라 부른다
- $\displaystyle\sum_{i=1}^{m}{\displaystyle\sum_{j=1}^{m}{c _{i}\bar{c _{j}}K _{ij}}} \ge 0$
-
선형범함수
- 어떠한 함수 공간V을 정의역으로 하고, 실수 R 또는 복소수 C 를 공역으로 하는 함수. 선형범함수들이 모인 벡터공간 L(V,F) 를 V 의 쌍대공간이라고 부른다
- 모든 선형변환은 행렬로 표현될 수 있다는 사실이 필요충분조건이기 때문에 L(V,F) 가 행렬로 표현될 경우 그 크기는 dim(V)×1 이므로 V 와 차원이 동일하다
- 같은 체 위에서 정의된 같은 차원을 갖는 벡터공간 V, L(V,F) 는 동형사상이다는 사실과 필요충분조건이다
- 조건
- 순서기저 β={v1,v2,⋯,vn} 을 갖는 유한차원 벡터공간 V 와 β 에 대하여 j 번째 좌표함수를 fj 라고 하자.
- 정리
- 이때 β∗={f1,f2,⋯,fn} 는 쌍대공간 V∗ 의 순서기저이다
- 임의의 f∈V∗ 에 대하여 f=i=1∑nf(xi)fi 이다
-
리즈의 표현 정리 Riesz Representation Theorem
- 정리
- (H,⟨⋅,⋅⟩) 가 힐버트 공간이라 하자. H 의 선형범함수 f∈H∗ 와 x∈H 에 대해 f(x)=⟨x,w⟩ 와 ∥f∥H∗=∥w∥H 를 만족시키는 w∈H 가 유일하게 존재한다
- 증명
1. 직교분해정리
- 힐버트 공간 H 의 부분공간 W 에 대하여 H=W⊕W⊥ 을 만족하는 W⊥ 이 존재한다
- W=ker(f)={x∈H:f(x)=0} 이라고 하자. ker(f) 는 부분공간이므로 H=W⊕W⊥ 을 만족시키고, W={0} 이다. 따라서 ∥y∥=1 인 y∈W⊥ 을 선택하자. W⊥ 도 벡터공간이므로, 0이 아닌 원소 하나라도 존재한다면 이러한 y 의 존재는 반드시 보장된다
- 임의의 벡터 x∈H 에 대하여 다음과 같은 벡터 z∈H 를 고려해보자. z≡f(x)y−f(y)x
- f(x),f(y) 는 상수임을 유의하자. 이때 f 의 선형성을 고려하자
-
f(z)=f(f(x)y−f(y)x)=f(x)f(y)−f(y)f(x)=0
- 따라서 z∈W 이다.
- ⟨z,y⟩=⟨f(x)y−f(y)x,y⟩=0
-
⟨z,y⟩=f(x)⟨y,y⟩−f(y)⟨x,y⟩=f(x)∥y∥2−f(y)⟨x,y⟩=f(x)−f(y)⟨x,y⟩=0
- f(x)=f(y)⟨x,y⟩=<x,f(y)y>
- w=f(y)y 라고 한다면 f(x)=⟨x,w⟩ 이다. 이때 코시 슈바르츠 부등식에 의해
-
∥f∥=sup∥x∥=1∣f(x)∣=sup∥x∥=1∣⟨x,y⟩∣≤sup∥x∥=1∥x∥⋅∥w∥ 이다
- 임의의 벡터인 x∈H 를 x1∈W 와 x2∈W⊥ 으로 표현하자
- ⟨x1+x2,w⟩=⟨x2,w⟩ 인데, supremum 값을 찾으라는 조건이 달려있으므로 x=x2=∥w∥w
- 따라서 ∥f∥=⟨∥w∥w,w⟩=∥w∥
-
유일성 증명
- w′ 이 다음을 만족시킨다고 하자
- f(x)=⟨x,w′⟩
- 보조정리: 힐버트 공간 H 의 임의의 원소 x∈H 와 어떤 원소 y,z∈H ⟨x,y⟩=⟨x,z⟩ 라면 y=z 임을 활용한다. ⟨x,y−z⟩=0 의 식에서 x=y−z 를 대입하여 증명할 수 있다
- 따라서 w=w′
- * Friedberg 선형대수 한글 5판 380 정리 6.8에 다른 형태의 정의가 존재함
-
Evaluation functional
- X 가 임의의 집합이고, H 가 실함수를 원소로 하는 힐버트 공간이라 하자. evaluation functional은 다음과 같이 정의된다
- Lx:f→f(x) (임의의 f∈H 에 대하여)
- functional이란 함수를 Input으로 받는 함수이다. evaluation이란 어떤 점 x 에서 함수 f 에 x 를 대입하여 f(x) 를 얻는 과정을 의미한다.
-
재생 커널 힐버트(RKHS) Reproducing Kernel Hilbert Space
- 어떤 힐버트 공간 H 가 있고, 모든 x∈X 에 대하여, 모든 f∈H 에 대하여 평가범함수 Lx 가 연속이고 Lx 가 유계되어있다면(어떤 M이 존재하여) H 를 reproducing hilbert space라 부른다
- ∣Lx(f)∣=∣f(x)∣≤M
- Riesz의 표현정리와 결합하자. 각각 어떤 영집합이 아닌 집합 X, 힐버트공간 H, H 의 쌍대공간 H∗가 있다하자. 임의의 두 원소x,y∈X , 임의의 함수 f, 어떤 선형범함수 Lx,Ly∈H∗ 가 있다하자
- Riesz 표현정리에 의하면 Lx(f)=⟨f,Kx⟩H=f(x) , Ly(f)=⟨f,Ky⟩H=f(y)를 만족시키는 Kx,Ky∈H 가 존재한다
- 그런데 Kx,Ky:X→R 이다. 따라서
- Lx(Ky)=⟨Ky,Kx⟩H=Ky(x)
- Ly(Kx)=⟨Kx,Ky⟩H=Kx(y) 이다
- 실수체 R 위에선 내적은 symmetry한 함수이므로 다음과 같이 reproducing kernel을 정의할 수 있다
- K(x,y)=⟨Kx,Ky⟩H=Ky(x)=Kx(y)
- i,j=1∑ncicjK(xi,xj)=⟨i=1∑nciKxi,j=1∑ncjKxj⟩=∥i=1∑nciKxi∥H2≥0 이므로 K 는 positive definite kernel이다