기하학적 의미
행렬 = 선형변환, 벡터 공간을 다른 벡터 공간으로 mapping
데이터 구조적 의미
각 feature의 변동이 얼마나 닮았는지 비교 ⇒ 분산 계산
개수의 크기가 커지면 값이 커지므로 이를 방지하기 위해 n으로 나눕니다.
- 모든 변수에 대하여 분산과 공분산 값을 나타내는 정사각 행렬입니다.
- 주 대각선 성분은 자기 자신의 분산 값을 나타냅니다.
- 주 대각선 이외의 성분은 가능한 두 변수의 공분산 값을 나타냅니다.
[df.cov()] 또는 [np.cov()]
를 사용하여 구할 수 있습니다.
[df.corr()] 또는 [np.corrcoef()]
를 사용하여 구할 수 있습니다.