주어진 영상에 특정 알고리즘을 적용하여 변환된 이미지를 얻어내는 것. 자유도(Degree of Freedom)로 물체의 위치와 상태를 나타내기 위해 필요한 변수의 개수를 의미한다.Euclidean transformation이라고도 하며 형태와 크기를 유지한 채 위치와
3D에서의 회전은 각 축을 기준으로 $\\theta$만큼 회전할 때의 회전행렬로 나타낼 수 있다.$x,y,z$축에서의 회전 각을 각각 $\\alpha, \\beta, \\gamma$라고 할 때 3D 회전은 회전변환을 조합하여 다음과 같이 표현할 수 있다.$R=R_z(\
회전을 표현할 때, 행렬 대신 사용하는 수학적 개념으로 4개의 값으로 이루어진 복소수 체계이다.$\\mathbf{q}=\\begin{bmatrix} q\\ \\boldsymbol{q} \\end{bmatrix}$ with $\\boldsymbol{q} = \\begin
Focal length
Vector space에서의 값은 원점에서 뻗어나가는 방향을 의미하며 선형성을 지닌다.벡터의 위치와 관계없이 크기와 방향이 같다면 모두 같은 벡터로 인식되기 때문에 위치가 중요한 경우를 표현할 수 없다.Translation은 scale, rotation, shear과는
Pinhole camera를 사용할 때 image plane에 맺히는 상은 뒤집힌 상태이기 때문에 object와 카메라 사이에 virtual image plane을 만든다.3차원의 object를 2차원의 image plane에 투영시키는 행렬 $P$가 존재할 때 $x
두 개의 독립적인 벡터 $a,b$가 있을 때 $a \\times b$는 $a,b$ 모두에 직교하고 두 벡터를 포함하는 평면에 수직이다.두 벡터의 방향이 같거나, 하나가 다른 하나의 마이너스 부호 혹은 둘 중 하나의 벡터의 크기가 0이라면 외적은 0이다.직교하는 두 벡터
$p$: 3D object point$x,x'$: $p$가 투영되는 2개의 image plane에서의 좌표$o,o'$: 두 카메라의 원점$e,e'$: 두 카메라의 원점을 이어주는 baseline이 image plane과 만나는 점으로 Epipole이라고 정의한다.$l,
Fundamental matrix $F$를 구하기 위해서는 8개의 매칭쌍이 필요하다.(homogenous coordinate를 사용하기 때문에 $f_9$는 1이다)식을 풀어쓰면 그림2와 같다.매칭쌍이 $M$개일 때 그림3과 같이 $Af=0$으로 나타낼 수 있으며 $||
World 좌표계로부터 image plane 상의 2D point를 구하기 위해서는 5개의 intrinsic parameters와 6개의 extrinsic parameters가 필요하다.하나의 매칭쌍으로부터 2개의 식이 도출되므로 최소 6쌍의 매칭점이 필요하다.행렬 $
LU분해는 위 그림과 같이 lower trianguler matrix와 upper triangular matrix로 분해하는 것을 의마한다.$A=LU$에서 $A$가 symmetric matrix라면 $A=A^T$이므로 $A=LL^T=L^TL$과 같은 형태로 분해하여 L