인공지능을 활용하는 분야는 정말 다양하고 그 분류 또한 다양하다. 그 중 사진이나 동영상 같은 이미지, 카메라와 관련된 분야를 흔히 컴퓨터 비전이라고 부른다. 이 컴퓨터 비전에는 OCR, 이미지 인식, 패턴 인식, 얼굴 인식, 객체 탐지 등 세부 분야가 존재한다.
얼굴 인식 기술은 말 그대로 이미지 내부에서 사람의 얼굴을 찾는 기술이다. 얼굴 인식은 크게 2단계로 이루어진다. 이미지 내부에 얼굴의 위치를 찾는 얼굴 검출(Face Detaction)과 해당 얼굴을 분류하는 얼굴 인식(Face Recognition)이 그것이다.
여기서 얼굴 인식은 다시 2가지로 나뉠 수 있다. 하나는 1:1검증으로 두 장의 얼굴 사진으로 서로 동일인여부를 판단하는 얼굴 검증(Face Verification)이고, 다른 하나는 1:N 검증으로 새로 들어온 얼굴 사진이 기존에 존재하는 DB에 있는 사람인지를 판단하는 얼굴 식별(Face Identification)이다.
얼굴 검증 모델은 두 장의 사진을 Input하면 그곳에서 각각 먼저 얼굴을 검출한다. 그 다음 특징을 뽑기 위해서 사전 훈련된 Backbone network에 넣어서 특징을 추출하게 된다. 이때 특징을 더 잘 추출하기 위해서 얼굴을 정렬하는 등의 전처리를 할 수 있다.
전처리와 Backbone을 거치면 얼굴 사진에서 Embedding Vector가 추출된다. 이 벡터 간의 거리 차이로 두 얼굴의 동일인 여부를 결정한다. 거리 차이가 임계값(Threshold)를 넘어가면 비동일인으로, 임계값을 넘지 않으면 동일인으로 판단한다.