데이터를 고유벡터에 선형 투영하기

cuckoo·2022년 10월 25일
0

선형대수

목록 보기
7/11

linear projection(선형 투영)

Projection이란 한 벡터를 다른 벡터의 공간에 표기하는 것이라고 생각할 수 있습니다.

아래 그림에서 vector b를 vector a 위의 vector p 로 projection 한 것이다.vector a가 선(1차원) 위에 있는 경우, vector p는 아무리 스케일을 변화시켜도 결국 선 위에 있게 됩니다.

e = b-p 에서 e는 Error이다. 바로 e를 통해서 직교성을 알 수 있습니다.

데이터를 고유벡터에 투영하기

  • PCA는 데이터를 축에 수직으로 투영하는 것인데, 고유벡터는 이 축의 단위벡터입니다.
  • linear projection위 식에서 변환된 데이터를 , 기존 데이터를 , 고유벡터를 라 할 때, 는 1이므로 는 이 에서 어디쯤 위치하는지 나타내주는 스칼라값과 같습니다.
  • 위 식에서 변환된 데이터를 w′, 기존 데이터를 w, 고유벡터를 v라 할 때, v⋅v는 1이므로 w⋅v는 w′이 v에서 어디쯤 위치하는지 나타내주는 스칼라값과 같습니다.
  • 이에 따라 투영된 데이터는 기존 데이터와 고유벡터의 내적과 같습니다.
profile
ENTJ 데이터 분석가 준비중입니다:)

0개의 댓글