[면접대비] 통계 및 수학 1

Mattaaa·2022년 3월 16일
0

면접대비

목록 보기
1/4

1. 고유값(eigen value)와 고유벡터(eigen vector)에 대해 설명해주세요. 그리고 왜 중요할까요?

2. 샘플링(Sampling)과 리샘플링(Resampling)에 대해 설명해주세요. 리샘플링은 무슨 장점이 있을까요?

3. 확률 모형과 확률 변수는 무엇일까요?




1. 고유값(eigen value)와 고유벡터(eigen vector)에 대해 설명해주세요. 그리고 왜 중요할까요?

정방행렬 A를 선형 변환으로 보고, 선형 변환 A에 의한 결과가 자기 자신의 상수 배가 되는 0이 아닌 벡터를 고유벡터(eigenvector)라고 하고, 해당 상수 배 값을 고유값(eigenvalue) 라 합니다.
고유값과 고유벡터는 SVD(특이값분해), Pesudo-Inverse, 선형연립방정식 , PCA 등에서 밑바탕이 되는 개념들이기 때문에 중요합니다.






선형 변환은 벡터에 사칙연산을 해주는 개념이랑 비슷하다.
따라서, 위의 식을 예시로 들면 벡터 v에 행렬 A를 곱해주는 것을 선형 변환이라 한다.
또한, 만약 그 값이 벡터 v의 상수배와 동일하다면 선형 변환 A에 대하여 v를 고유벡터, λ를 고유값 이라 한다는 것이다.
이때, 위의 식이 만족 한다는 것은 벡터 v의 방향은 변하지 않고 크기만 변했음을 뜻한다. 아래 그림을 보면 이해가 쉽게 될 것이다.

                                                            그림[1] (출처 : 공돌이의 수학 정리 노트)


                                                            그림[2] (출처 : 공돌이의 수학 정리 노트)

그림2는 그림1 상의 벡터들을 선형 변환한 것을 나타냈다. 그림 1의 벡터는 파랑,빨강,분홍 총 3가지이다.

빨강 벡터를 살펴보면, 선형 변환 후 크기뿐만 아니라 방향 또한 같이 변한 것을 볼 수 있다. 따라서, 해당 벡터는 고유벡터가 아니다.

반면, 파랑, 분홍 벡터는 크기만 변했을 뿐 방향은 변하지 않았다. 따라서, 고유벡터이며, (그림2의 해당벡터의 크기 / 그림1의 해당벡터의 크기) 값이 고유값이 될 것이다.



2. 샘플링과 리샘플링에 대해 설명해주세요. 리샘플링은 무슨 장점이 있을까요?

샘플링은 표본추출을 뜻하는 것으로, 모집단에서 임의의 sample을 뽑는 것을 뜻합니다.
리샘플링은 샘플링을 통해 뽑은 sample 들에서 또 다시 sample의 부분집합을 뽑는 것입니다.
리샘플링을 하게되면, 같은 샘플을 여러번 사용 하게되는데 이를 이용하여 성능 측정 시 통계적인 신뢰도를 높일 수 있습니다.

K-Fold cross validation 을 예로 들 수 있는데, 매 Fold 마다, Train dataset 내에서 validation set 과 train set을 다르게 채택하면서, 좀 더 일반화된 결과를 만들어낼 수 있습니다.



3. 확률 모형과 확률 변수는 무엇일까요?

확률 모형은 분포 함수 또는 밀도 함수라고 불리는 미리 정해진 함수 수식을 통해 분포의 모양을 정의하는 방법입니다. 이때 분포의 모수에 따라 모양이 결정됩니다. 정규분포가 이에 해당합니다.

확률 변수는 특정 확률로 발생하는 결과를 수치적으로 표현한 변수를 뜻합니다. 예를 들어, 10번 동전을 던져 앞면이 나오는 횟수를 X 라 하면 이는 1/2이라는 특정 확률로 발생하는 결과를 수치적으로 표현하는 변수이므로 확률 변수에 해당합니다.

0개의 댓글