좌 냥이 우 댕댕 사람은 보는 즉시 인식이 가능하다.
그럼 사진에서 뭘 보고 냥, 댕이라는걸 알 수 있었을까?
고양이, 개로 추정되는 정보들이 많다.
수염, 눈동자, 생김새 등 우리가 겪은 모든 것들
하지만 컴퓨터나 알고리즘 또는 소프트웨어가 어떻게 이런걸 할까?
그걸 가능하게 해준것이 컨볼루션 신경망이다.
이미지를 인식하는 데 사용되는 인공 신경망의 한 유형
여기 손으로 적은 숫자 1이 있다.
다시 그게 뭔지 컴퓨터에게 어떻게 알아내라고 할까?
전체적인 모양이거나 다른 이유일수 있다.
기본적으로 콘볼루션 신경망은 많은 필터를 거친다.
이 필터들로 이미지의 여러 부분에서 특징을 추출할 수 있다.
이미지에 수많은 작은 필터들을 지나와, 분석해서 가능성을 도출해내는 것이다.
여기서 작은 필터들의 관점으로 봤을때,
사람은 이걸 봤을때 뭔지 모르지만, 학습 된 CNN은 이것이 사과라고 말할것이다.
애초에 작은 필터로 이미지를 봤기 때문이다.
이처럼 CNN은 사람의 뉴런네트워크를 이용해 학습했지만 사람의 수준을 넘어서는 일이 가능하다.