선형결합
av + bw
두 스칼라 중 하나는 고정해놓고 나머지 하나의 값을 자유롭게 놓는다면,
벡터의 머리가 한 직선을 그리게 된다
span 선형생성
벡터 v 와 w 의 span : 선형결합의 집합
선형종속 linearly dependent
벡터 u가 다른 벡터들의 선형결합으로 표현가능
u = av + bw
ex) 3차원 매트릭스의 세 벡터 중 한 벡터가 선형종속일때
ex) 3차원 매트릭스의 세 벡터가 선형독립(linearly independent)일때
확률변수 X의 평균(기대값), Y의 평균을 각각
이라 했을 때, X,Y의 공분산은 아래와 같다.
즉, 공분산은 X의 편차와 Y의 편차를 곱한것의 평균
간단히 표현하면
X와 Y가 독립이면
이므로 공분산은 0이 된다.
df.cov()
공분산 matrix의 대각선 부분은 공분산이 아닌, 분산을 표현
값들에 대해서 순서 혹은 rank를 매기고, 그를 바탕으로 correlation을 측정하는 Non-parametric한 방식
<-> Pearson correlation (numeric) : correlation, coefficient
# ddof는 자유도
df.v1.var(ddof = 0)
df.v1.var(ddof = 1)
샘플분산 은 모집단 분산 의 추정치
샘플 분산 계산시 로 나눠야함
좌표상에 있는 거의 모든 벡터는 다른 벡터와 상관이 아주 작게라도 있음
-> 공분산, 상관계수 계산 가능
서로 수직인 벡터는 상관 관계가 없다
주어진 매트릭스를 "Row-Echelon form"으로 바꾸는 계산과정
Feature을 줄이는 과정에서 data loss (information of feature)
data 저장하기 위한 메모리 줄일 수 있음