컴퓨터를 사용해서 영상을 처리, 즉 이미지 처리를 연구하는 분야인 컴퓨터 비전에 속하며, 영상인식은 컴퓨터 비전의 핵심 작업이다.
오브젝트가 존재하는지에 대한 유무 판단
찾고자 하는 객체의 특징을 사전에 추출하고 주어진 영상에서 해당 특징을 검출해내는 접근을 사용한다. 객체 탐지를 통해서는 정해진 특징에 맞는 어떤 객체이다 정도 까지만 판단 가능하다.
검출된 객체, 그 객체 자체가 무엇인지 인식 시키는 개념
객체 탐지되어야 진행 가능하며, 객체가 라벨링 된다고 생각하면 된다.
탐지된 객체, 인식된 객체를 매 프레임마다 확인하면서 그 객체가 어떻게 어디로 움직이는지 등을 파악하며 추적하는 것
객체 탐지, 인식이 선행되어야 진행할 수 있다.
단순히 분류에 그치지 않고 인식된 대상을 픽셀 단위로 정확히 분할하고 나누어내는 것
가장 중요한 것은 영상이 인식되려면 먼저 객체의 특징을 사전에 정의하고 추출해야 한다는 것이다. 영상에 대한 특징을 구하는 것은 숫자값들이 확 변하거나 내가 검출한 점이나 픽셀 간격이 확 벌어진다는 등의 특징을 구할 수 있다. 이러한 특징을 구하려면 애매하게 차이나는 것들을 확실하게 구분지어서 특징을 보다 쉽게 잡는다거나 관심 있는 것 이외의 것들에 영향을 미치지 않게 해서 특징을 잡기 쉽게 해주는 등의 전처리 또는 처리 과정이 필요하다.
원 화소의 값이나 위치를 바탕으로 단일 화소 값을 변경하는 기술
화소 점, 픽셀의 원래 값이나 위치를 기준으로 그 픽셀 안의 값을 변경하면서 이루어지는 처리로 산술 연산과 논리 연산의 방법이 있다.
픽셀의 원래 값과 이웃하는 여러 픽셀이 서로 관계하여 생성된 픽셀 값을 기준으로 값이 변경 되는 것
블러링 : 영상 세세한 부분까지 제거해 흐릿하게 만든다.
샤프닝 : 주변 픽셀을 대비해서 값이 크게 변하는 경계 부분이 돋보이게 하는 기법으로 개체들의 윤곽이 뚜렷해진다.
디지털 영상 픽셀의 위치나 픽셀의 모임인 배열을 변화시키는 방법
두가지 이상의 서로다른 영상으로 각종 연산을 조합하여 새로운 픽셀값을 생성
1초전 영상과 현재의 영상에서 1초전 영상 - 현재의 영상 의 값이 0이 아니라면 그 부분을 흰색으로, 0인 부분을 흑색으로 처리한다.
인공지능의 영상 인식률이 점차 높아져 98%까지 이끌어내었고 사람의 인식률 98.5%로 거의 비슷한 수준이 되었다. 예외적인 상황이 없는 일반적인 물체로 많은 데이터를 모을 수 있었고 계속해서 학습하고 보완이 가능하기 때문에 이러한 발전을 이루어낼 수 있었다.
데이터 수집 > 전처리 > 특징추출 > 학습 > 검증
트레이딩 데이터 셋을 모으는 것은 데이터 수집에서 특징추출 과정 사이에 이루어지고, 학습 시키고 추론 결과를 살피는 것은 학습에서 검증 과정 사이에 이루어진다. 인공지능 학습 과정에서 보다 빠르고 정확하게 학습을 위해 날 것의 영상 데이터가 아니라 전처리가 되어있는 특징이 잘 나타나 있는 사진을 학습한다.
학습 데이터는 밝기와 크기를 비슷하게 맞추고, 여백을 최대한 줄여 효율적으로 데이터 수집을 할 수 있도록 해야한다. 이러한 학습 방식에 따라 인공지능의 성능 또한 달라지게 된다.
무한한 데이터와 무한한 시간이 있는 상황에서는 인공지능이 우수하지만, 돈을 투자할 산업과 소비자 모두 각기 다른 상황에서는 효율에 따라 인공지능 방식의 영상인식과 전통적인 영상인식 중 선택해야 한다.