7.2 Quadratic Form

Jaehyun_onelion·2023년 3월 17일
0

선형대수학

목록 보기
39/42

이번 포스트에서는 quadratic form에 대해 알아보겠습니다.


1) Quadratic Form


(1) Quadratic Form

Quadratic form이 무엇인지 알아보겠습니다.


Definition : Quadratic Form

A quadratic form on Rn\mathbb R^n is a function QQ defined on Rn\mathbb R^n whose valude at a vector x\boldsymbol x in Rn\mathbb R^n can be computed by an expression of the form

Q(x)=xTAxQ(\boldsymbol x) = \boldsymbol x ^T A \boldsymbol x

where AA is $n\times n $ symmetric matrix

The matrix AA is called the matrix of the quadratic form.

Quadratic form은 symmetric matrix AA로 정의되는 정의역이 Rn\mathbb R^n이고 공역이 R\mathbb R인 함수입니다. 함수식은 위와 같이 정의되구요.


Example

Q(x)=xTIx=x2Q(\boldsymbol x) = \boldsymbol x^T I \boldsymbol x = \|\boldsymbol x\|^2

Norm, Length는 quadratic form입니다. 해당 quadratic form에 해당하는 matrix는 identity matrix이구요.


Example

x=[x1x2],  A=[4003],  B=[3227]\boldsymbol x= \begin{bmatrix}x_1 \\ x_2 \end{bmatrix}, \ \ A=\begin{bmatrix}4 & 0 \\ 0 & 3\end{bmatrix}, \ \ B=\begin{bmatrix}3 & -2 \\ -2 & 7\end{bmatrix}

해당 matrix A,BA, B를 이용하여 quadrtic form을 정의할 수 있습니다.

QA(x)=xTAx=4x12+3x22QB(x)=xTBx=3x124x1x2+7x22Q_A(\boldsymbol x) = \boldsymbol x^TA\boldsymbol x = 4x_1^2+3x_2^2 \\ Q_B(\boldsymbol x) = \boldsymbol x^TB\boldsymbol x = 3x_1^2 - 4x_1x_2 + 7x_2^2

두 예시에서 알 수 있듯이, 다음 함수를 quadratic form(이차 형식)으로 정의하는 이유 중 하나는, 결과값의 차수가 2이기 때문입니다.

Quadratic form에서 사용되는 matrix가 symmetric matrix이므로, 이를 이용하여 quadratic form 계산을 빠르게 할 수 있습니다.


Example

Q(x)=5x12+3x22+2x322x1x2+8x2x3Q(\boldsymbol x) = 5x_1^2+3x_2^2 +2x_3^2 -2x_1x_2+8x_2x_3

해당 식을 보면, x\boldsymbol xR3\mathbb R^3에 속한 벡터입니다. 이를 이용하여 해당 quadratic form의 matrix를 구할 수 있습니다.

A=[abcbdecef]A = \begin{bmatrix}a & b & c \\ b & d & e \\ c & e & f\end{bmatrix}

AA를 정의하면

QA(x)=xTAx=ax12+dx22+fx32+2bx1x2+2cx1x3+2ex2x3Q_A(\boldsymbol x) = \boldsymbol x^T A \boldsymbol x = ax_1^2+dx_2^2+fx_3^2+ 2bx_1x_2 +2cx_1x_3+2ex_2x_3

임을 알 수 있고, 이를 통해

a=5, b=1, c=0, d=3, e=4, f=2a=5, \ b=-1, \ c=0, \ d=3, \ e=4, \ f=2

A=[510134042]A = \begin{bmatrix} 5 & -1 & 0 \\ -1 & 3 & 4 \\ 0 & 4 & 2 \end{bmatrix}

임을 알 수 있습니다.


(2) Types of Quadratic form


Quadratic Form에 대응하는 matrix에 따라 결과값이 어떻게 변화하는지 확인할 수 있습니다. 예를 들어

A=[4003]A=\begin{bmatrix}4 & 0 \\ 0 & 3\end{bmatrix}

에 해당하는 quadratic form QA(x)Q_A(\boldsymbol x)

QA(x)=4x12+3x22Q_A(\boldsymbol x) = 4x_1^2 + 3x_2^2

은 모든 xR2\boldsymbol x \in \mathbb R^2에 대해서 0보다 크거나 같은 값을 가집니다. 한편

B=[4003]B=\begin{bmatrix}-4 & 0 \\ 0 & -3\end{bmatrix}

에 해당하는 quadratic form QB(x)Q_B(\boldsymbol x)

QB(x)=4x123x22Q_B(\boldsymbol x) =-4x_1^2 -3x_2^2

은 모든 xR2\boldsymbol x\in \mathbb R^2에 대해서 0보다 작거나 큰 값을 가집니다.

C=[4003]C=\begin{bmatrix}-4 & 0\\ 0 & 3\end{bmatrix}

에 해당하는 quadratic form QC(x)Q_C(\boldsymbol x)

QC(x)=4x12+3x22Q_C(\boldsymbol x) = -4x_1^2+3x_2^2

x\boldsymbol x에 따라 양의 값, 음의 값을 가질 수 있습니다.

Quadratic form에서 위와 같이 모든 xRn\boldsymbol x \in \mathbb R^n에 대해 양의 값을 가지는지, 음의 값을 가지는지는 중요한 특징 중 하나입니다. 따라서 이를 통해 quadratic form을 분류합니다.


Definition : Classifying Quadratic Forms

When AA is an n×nn \times n matrix, the quadratic form Q(x)=xTAxQ(\boldsymbol x) = \boldsymbol x ^T A \boldsymbol x is a real-valued function with domain Rn\mathbb R^n. A quadratic form QQ is

  1. Positive Definite if Q(x)>0Q(\boldsymbol x)>0 for all x0\boldsymbol x \neq 0
  2. Positive Semidefinite if Q(x)0Q(\boldsymbol x)\geq0
  3. Negative Definite if Q(x)<0Q(\boldsymbol x) <0 for all x0\boldsymbol x\neq 0
  4. Negativve Semidefinite if Q(x)0Q(\boldsymbol x)\leq 0
  5. Indefinite if Q(x)Q(\boldsymbol x) assumes both positive and negative values

위의 예시에서 QAQ_A는 positive definite(or positive semidefinite), QBQ_B는 negative definite(or negative semidefinite), QCQ_C는 indefinite인 것을 알 수 있습니다.

위의 quadratic form에 해당하는 matrix A,B,CA, B, C가 가지는 특징은 모두 diagonal matrix라는 점입니다. diagonal matrix에 대한 quadratic form을 계산하면 결과값에 제곱항에 대한 식만 남게 됩니다. 실수는 제곱하는 순간 0보다 크거나 같기 때문에, 제곱항의 계수에 따라 해당 quadratic form이 positive definite인지, negative definite인지, indefinite인지 확인할 수 있습니다. 하지만, 다음과 같은 matrix EE

E=[4223]E=\begin{bmatrix}4 & 2 \\ 2 & 3\end{bmatrix}

에 대응하는 quadratic form QE(x)Q_E(\boldsymbol x)

QD(x)=4x12+4x1x2+3x22Q_D(\boldsymbol x) = 4x_1^2+4x_1x_2+3x_2^2

은 모든 xR2\boldsymbol x \in \mathbb R^2에 대해서 양의 값을 가지는지, 음의 값을 가지는지, 알 수 없는지 바로 확인을 하기가 어렵니다. 이는 x1x2x_1x_2항이 존재하기 때문입니다. x1,x2x_1, x_2의 부호에 따라 양의 값을 가지기도, 음의 값을 가지기도 하기 때문입니다. 따라서 해당 matrix가 어떤 quadratic form을 가지는지 확인하기 위해, 이전 포스트에서 배웠떤 spectral decomposition을 이용합니다.


3) Change of Variable in a Quadratic Form


위의 예시에서 QEQ_E가 어떤 type인지 확인하는 쉬운 방법은 x1x2x_1x_2항을 없애주는 것입니다. 즉, EE를 적절한 방법을 이용하여 diagonal matrix로 만들어주면 됩니다. Diagonal matrix로 만들어주기 위해 이전 포스트에서 배운 Spectral Decomposition과 Change of Variable 개념을 사용합니다.

xRn\boldsymbol x \in \mathbb R^n일 때, standard basis에 해당하는 coordinate vector가 x\boldsymbol x가 됩니다. 즉

x=[x]ϵ\boldsymbol x = \left[\boldsymbol x\right]_{\epsilon}

이를 standard basis가 아닌 n×nn\times n invertible matrix PP의 column으로 이루어진 basis에 해당하는 coordinate vector는 다음과 같이 표현이 가능합니다.

x=Py\boldsymbol x = P\boldsymbol y

PP는 invertible하므로,

P1x=y=[x]BB={p1,...,pn}P^{-1}\boldsymbol x = \boldsymbol y = [\boldsymbol x]_B \\ B = \{\boldsymbol p_1, ..., \boldsymbol p_n\}

y\boldsymbol yPP의 column으로 이루어진 basis를 이용하여 표현한 x\boldsymbol x의 coordinate vector가 됩니다.

한편, Quadratic Form QEQ_E에 대응하는 matrix EE는 symmetric matrix이므로, spectral decomposition를 적용하면

E=PDPT,  whereP=[p1...pn],  D=diag(λ1,...,λn)E = PDP^T, \ \ where \\ P = \begin{bmatrix}\boldsymbol p_1 & ... & \boldsymbol p_n \end{bmatrix}, \ \ D = diag(\lambda_1, ..., \lambda_n)

으로 표현가능합니다. λ1,...,λn\lambda_1, ..., \lambda_nEE의 eigenvalue이고, p1,...,pn\boldsymbol p_1, ..., \boldsymbol p_n은 length가 1인 λ1,...,λn\lambda_1, ..., \lambda_n에 대응되는 eigenvector이구요. spectral decomposition을 이용하여 quadratic form을 표현하면

QE(x)=xTEx=xTPDPTx=(PTx)TD(PTx)Q_E(\boldsymbol x) = \boldsymbol x^T E \boldsymbol x = \boldsymbol x^TPDP^T\boldsymbol x = (P^T\boldsymbol x)^TD(P^T\boldsymbol x)

가 됩니다. 이 때, P1=PTP^{-1}=P^T이므로 (P는 orthogonal matrix입니다.) 위에서 정의한

y=P1x=PTx\boldsymbol y = P^{-1}\boldsymbol x = P^T\boldsymbol x

가 되어 이를 이용하여 표현하면

QE(x)=yTDyy=PTxQ_E(\boldsymbol x) = \boldsymbol y^TD\boldsymbol y \\ \boldsymbol y =P^T\boldsymbol x

임을 알 수 있습니다. 이 때, PP는 invertible하므로, x\boldsymbol xy\boldsymbol y는 일대일 대응이고, y\boldsymbol y가 가질 수 있는 값은 Rn\mathbb R^n 전체입니다. 따라서 모든 xRn\boldsymbol x \in \mathbb R^n에 대해 해당 quadratic form의 결과를 비교하는 것은, 모든 yRn\boldsymbol y\in \mathbb R^n에 대해

yTDy\boldsymbol y^TD\boldsymbol y

의 결과를 비교하는 것과 같습니다. 이제, 중앙의 matrix가 diagonal matrix이므로, 위의 quadratic form이 모든 x\boldsymbol x(or y\boldsymbol y)에 대해 양의 값을 가지는지, 음의 값을 가지는지, 알 수 없는지 확인할 수 있고, 따라서 positive definite인지, negative definite인지, indefinite인지 구별할 수 있습니다.

해당 개념을 보여주는 정리가 principal axes theorem입니다.


Theorem : Principal Axes Theorem

Let AA be an n×nn \times n symmetric matrix. Then there is an orthogonal change of variable, x=Py\boldsymbol x = P\boldsymbol y, that transforms the quadratic form xTAx\boldsymbol x^TA\boldsymbol x into the quadratic form yTDy\boldsymbol y^TD\boldsymbol y with no cross-product term.

The columns of PP are called the principal axes of the quadratic form xTAx\boldsymbol x^T A\boldsymbol x

The vector y\boldsymbol y is the coordinate vector of x\boldsymbol x relative to the orthonormal basis of Rn\mathbb R^n given by these principal axes.

AAn×nn\times n symmetric matrix일 때, spectral decomposition을 이용하여 A=PDPTA=PDP^T로 orthogonally diagonalizable하고, 이를 통해 quadratic form을

QA(x)=xTAx=(PTx)TDPTx=yTDyQ_A(\boldsymbol x ) = \boldsymbol x^TA\boldsymbol x = (P^T\boldsymbol x)^TDP^T\boldsymbol x = \boldsymbol y^TD\boldsymbol y

로 표현할 수 있습니다. 이 때, DD는 diagonal matrix이므로, cross-product term(ex: x1x2,x2x3,...x_1x_2, x_2x_3, ...)이 없고, 제곱항으로만 표현됩니다. 이 때, PP의 column을 principal axes라고 하고, y\boldsymbol y는 Principal axes로 이루어진 basis를 이용한 x\boldsymbol x의 coordinate vector

y=[x]BB={p1,...,pn}\boldsymbol y = [\boldsymbol x]_B \\ B = \{\boldsymbol p_1, ..., \boldsymbol p_n\}

입니다.


Example

Q(x)=x128x1x25x22Q(\boldsymbol x) = x_1^2 -8x_1x_2 -5x_2^2

해당 quadratic form에 해당하는 matrix는

A=[1445]A = \begin{bmatrix}1 & -4 \\ -4 & -5 \end{bmatrix}

인 것을 알 수 있습니다. AA는 symmetric이므로, spectral decomposition을 위해 AA의 eigenvalue와 eigenvector를 구해보면

  • Eigenvalue
det(AλI)=(1λ)(5λ)16=λ2+4λ21=0λ=7,3\det(A-\lambda I) = (1-\lambda)(-5-\lambda)-16 = \lambda^2 +4\lambda -21 = 0 \\ \lambda = -7, 3
  • Eigenvector - λ=3\lambda=3
Ax=3x [240480][120000]A\boldsymbol x = 3\boldsymbol x \\ \ \\ \begin{bmatrix}-2 & -4 & 0 \\ -4 & -8&0 \end{bmatrix} \sim \begin{bmatrix}1 & 2 & 0 \\ 0 & 0&0 \end{bmatrix}
x=x2[21],  x2:free\boldsymbol x = x_2\begin{bmatrix}-2 \\ 1\end{bmatrix}, \ \ x_2 : free

크기가 1인 eigenvector는

p1=[2515]\boldsymbol p_1 =\begin{bmatrix}-\frac{2}{\sqrt 5} \\ \frac{1}{\sqrt 5} \end{bmatrix}
  • Eigenvector - λ=7\lambda =-7
Ax=7x [840420][1120000]A\boldsymbol x = -7\boldsymbol x \\ \ \\ \begin{bmatrix}8 & -4 & 0 \\ -4 & -2&0 \end{bmatrix} \sim \begin{bmatrix}1 & -\frac{1}{2} & 0 \\ 0 & 0&0 \end{bmatrix}
x=x2[121],  x2:free\boldsymbol x = x_2 \begin{bmatrix}\frac{1}{2} \\ 1 \end{bmatrix}, \ \ x_2 : free

이므로, 크기가 1인 eigenvector는

p2=[1525]\boldsymbol p_2 =\begin{bmatrix}\frac{1}{\sqrt5} \\ \frac{2}{\sqrt5} \end{bmatrix}

다음과 같이 eigenvalue와 eigenvector를 구할 수 있고, 이를 이용하여 diagonalization을 진행할 수 있습니다.

A=PDPT,  whereP=[p1p2],  D=[3007]A = PDP^T, \ \ where \\ P = \begin{bmatrix}\boldsymbol p_1 & \boldsymbol p_2 \end{bmatrix}, \ \ D = \begin{bmatrix}3 & 0 \\ 0 & -7 \end{bmatrix}

따라서, y=PTx\boldsymbol y = P^T\boldsymbol x로 정의하면, QAQ_A는 다음과 같이 바뀝니다.

QA(x)=yTDy=3y127y22Q_A(\boldsymbol x ) = \boldsymbol y^TD\boldsymbol y = 3y_1^2 -7y_2^2

y\boldsymbol y에 따라서 해당 quadratic form이 양의 값도, 음의 값도 가질 수 있기 때문에, 해당 quadratic form은 indefinite입니다.

지금까지 spectral decomposition을 통하여 해당 quadratic form에서 cross-product term을 없애는 방법에 대해 알아보았습니다. cross-product term을 없앤 결과값에서의 각각의 제곱항에 해당하는 계수는 해당 matrix의 eigenvalue였습니다. 따라서, eigenvalue가 어떤지에 따라서 해당 quadratic form의 type을 분류할 수 있습니다.


Theorem

Let AA be an n×nn \times n symmetric matrix. Then a quadratic form xTAx\boldsymbol x^T A \boldsymbol x is

  1. Positive definite if and only if the eigenvalues of AA are all positive
  2. Negative definte if and only if the eigenvalues of AA are all negative
  3. Indefinite if and only if AA has both positive and negative eigenvalues

이는

xTAx=yTDy=λ1y12+λ2y22++λnyn2\boldsymbol x^TA\boldsymbol x = \boldsymbol y^TD\boldsymbol y = \lambda_1y_1^2 + \lambda_2y_2^2 +\cdots + \lambda_ny_n^2

인데, y1,...,yny_1, ..., y_nR\mathbb R에 속하므로 제곱하면 항상 0보다 크거나 같기 때문에, 제곱항의 계수인 λ1,...,λn\lambda_1, ..., \lambda_n의 값에 따라 해당 quadratic form의 type을 결정할 수 있기 때문입니다.


Example

A=[320222021]A = \begin{bmatrix}3 & 2 & 0 \\ 2 & 2 & 2 \\ 0 & 2 & 1\end{bmatrix}

해당 matrix를 이용한 quadratic form QA(x)Q_A(\boldsymbol x)가 positive definite인지, negative definite인지, indefinite인지 확인해봅시다. AA의 eigenvalue를 구하면

det(AλI)=3λ2022λ2021λ=(3λ)2λ221λ22201λ=(3λ){(2λ)(1λ)4}2{2(1λ)}=(λ+1)(λ+2)(λ+5)=0\begin{aligned} \det(A-\lambda I) &= \begin{vmatrix}3-\lambda & 2 & 0 \\ 2 & 2-\lambda & 2 \\ 0 & 2 & 1-\lambda\end{vmatrix} = (3-\lambda)\begin{vmatrix}2-\lambda & 2 \\ 2 & 1-\lambda\end{vmatrix}-2\begin{vmatrix}2 & 2 \\ 0 & 1-\lambda\end{vmatrix} \\ &=(3-\lambda)\{(2-\lambda)(1-\lambda)-4\}-2\{2(1-\lambda)\} \\ &=(\lambda+1)(\lambda+2)(\lambda+5) = 0 \end{aligned}

이므로

λ=1,2,5\lambda = -1, -2, -5

입니다. 모든 eigenvalue가 음의 값을 가지기 때문에 해당 quadratic form은 negative definite입니다.


지금까지 quadratic form에 대해서 알아보았습니다. 다음 포스트에서는 Singular Value Decomposition에 대해서 알아보겠습니다. 질문이나 오류 있으면 댓글 남겨주세요! 감사합니다!

profile
데이터 분석가 새싹

0개의 댓글