Computer Vision(CV) - 1

박종일·2024년 1월 4일

The Difference Between Computer Vision and Human Vision

컴퓨터 비젼은 인간의 시야와 많은 유사점을 공유할 수 있지만 둘 사이에는 매우 중요한 차이가 있습니다.

인간의 시야는 이해하기 어려운 많은 것으로 구성되어져 있습니다. 생명과학 및 의학분야에서도 아직까지 많은 연구가 진행중 입니다. 이의 역할을 대신하는 컴퓨터 비젼은 컴퓨터가 인간의 비전 능력을 달성할 수 있도록 하는 인간 비전의 기술적 구현입니다.

What is Human Vision?

인간의 시각은 의심할 여지 없이 인간이 가지고 있는 오감 중에서 가장 중요한 것 중의 하나이며, 우리는 다른 모든 감각에 의존하고 있습니다. 인간의 시각은 빛을 중심으로 도는 특별하고 복잡한 시각입니다. 인간의 시각 시스템이 사물을 인식하고 해석하는 방식이 흥미롭습니다. 우리는 도로 위의 자동차, 식료품점 선반 위의 물건, 나무 위의 나뭇잎, 공장의 위젯, 하늘의 구름 등 사물을 있는 그대로 봅니다. 명확한 추론이 필요하지 않거나 각 객체 또는 장면을 해석하는 데 추가 노력이 필요합니다.

이 모든 것들은 눈과 그것들이 어떻게 빛의 패턴을 감지하고 우리가 그 때 보는 이미지로 빛을 변환하기 위해 뇌와 협력하는지에 달려 있습니다. 인간의 눈은 카메라와 매우 흡사한 매우 복잡한 광학계입니다. 빛은 여러분이 보고 있는 특정한 물체에서 튕겨져 나와 각막을 통해 눈으로 들어갑니다. 다음으로, 빛은 동공과 홍채를 통과하고, 홍채는 함께 눈으로 들어오는 빛의 양을 조절합니다. 이들 모두가 함께 움직일 때, 그들은 망막이라고 불리는 눈의 뒤쪽에 빛을 집중시킵니다. 빛이 망막에 닿으면, 망막 안에 포함된 미세한 세포들이 그것을 전기적인 신호로 바꿉니다.

What is Computer Vision?

컴퓨터 비전은 컴퓨터가 사진과 비디오와 같은 디지털 이미지의 내용물을 보고 이해할 수 있게 해주는 인공지능의 한 형태입니다. 그것은 컴퓨터가 인간의 비전이 사물을 인식하는 방법과 비슷하게 주변을 읽고 사물을 식별할 수 있게 해줍니다. 그리고 나서 그들은 알고리즘을 사용하여 인간 비전의 미리 정의된 특징들을 모으고 인간 비전의 능력을 모의실험 할 모델과 프로그램을 만들어냅니다. 이것은 컴퓨터에게 인간의 비전이 하는 방법과 비슷하게 시각 정보를 얻고, 분석하고 처리 할 수 있는 능력을 줍니다.

컴퓨터 비전의 가장 친숙한 구현들 중 하나는 얼굴 인식입니다. 얼굴 인식은 여러분의 모바일 기기에 대한 접근성을 확보하기 위해 사용됩니다. 컴퓨터 비전 뒤에 있는 아이디어는 이미지들로부터 유용한 정보를 추출하고, 제공된 정보에 기초하여 적절한 행동을 취하는 것입니다. 그것은 본질적으로, 컴퓨터가 인간의 작업을 모방하도록 인간 비전 시스템을 복제합니다. 단순한 기계 작업의 경우, 이것은 특별히 어렵지 않지만, 복잡한 작업의 경우, 기계는 시각적인 데이터를 시각화하고 해석하도록 훈련을 받아야 합니다.

Difference between Computer Vision and Human Vision

Perception

풍경 속의 나무, 선반 위의 책, 택시 안의 사람들, 노트북의 열쇠 등 인간은 사물, 장면, 패턴, 그리고 사람들을 있는 그대로 봅니다. 인간은 사물을 있는 그대로 인지하고 인식한 것을 유지하며, 그 사물들을 다시 발견할 때까지 뇌 속 깊은 곳에 저장합니다. 추론을 하거나 추가적인 노력을 할 필요 없이 뇌와 눈은 이 시각적인 것들을 계산하기 위해 함께 일합니다. 이러한 해석이 일어나는 속도는 매우 빠르며, 우리는 그것이 일어나고 있는지조차 깨닫지 못합니다. 반면 컴퓨터 비전은 일단 일련의 패턴과 이미지가 구현되면 컴퓨터가 주변을 해석하고 사물을 식별할 수 있게 해줍니다.

Working

인간의 시력은 전적으로 우리의 눈과 그것들이 빛의 패턴을 감지하고 그 빛을 우리가 보는 이미지로 변환하기 위해 뇌와 협력하는 방법에 의존합니다. 인간의 눈은 빛이 필요한 카메라와 비슷합니다. 빛이 눈에 닿으면, 그것은 특정한 각도를 형성하고 눈의 뒤쪽에서 이미지가 형성되고 그 이미지는 반전됩니다. 인간의 시력은 기능을 하기 위해 눈과 뇌의 협력이 필요합니다. 컴퓨터 시력은 기계 학습 기술과 알고리즘을 사용하여 물체를 크기나 색상으로 식별하고 구별하고 분류하며 사진과 비디오와 같은 시각 데이터의 패턴을 발견하고 해석합니다. 컴퓨터 시력은 그것의 시력 분야에서 물체를 식별함으로써 인간의 시력을 모방합니다.

Object Recognition

인간 시각 시스템의 주요 능력 중 하나는 불변의 물체 인식인데, 이는 인간이 다른 변화 형태의 물체를 즉각적이고 정확하게 식별할 수 있다는 것을 의미합니다. 인간은 이러한 물체를 전에 본 적이 없더라도 물체를 쉽게 인식하고 장면에서 물체를 묘사하는 데 문제가 없습니다. 컴퓨터는 픽셀 값의 배열과 다른 이미지를 묘사하기 위해 이미지에서 특징들의 집합을 추출해야 합니다. 단일 2D 이미지에서 3D 물체를 인식하는 것은 컴퓨터 비전에서 가장 까다로운 문제 중 하나입니다.

Computer Visions VS Human Vision

AspectComputer VisionHuman Vision
PerceptionComputer vision allows a computer to sense its surroundings and identify things.Humans perceive things as they are and retain what they recognize, storing it in the brain until they come across them again.
Techniques/ProcessesUses machine learning techniques and algorithms to identify, distinguish, and classify objects.Vision involves the eyes detecting light patterns and coordinating with the brain to translate light into images.
Object RecognitionObject recognition is one of the most challenging problems in computer vision.Humans recognize objects effortlessly and have no problems describing objects in a scene.

Is computer vision better than human vision?

컴퓨터 비전은 물체의 결함 탐지, 패턴 인식, 사기 탐지 등 단순한 기계 작업이나 주기적인 작업에 적합합니다. 많은 작업에서 인간보다 성능이 뛰어날 수 있지만 컴퓨터 비전이 인간의 비전에 비할 바가 아닌 부분이 많습니다. 불변의 물체 인식은 인간의 뇌 고유한 능력 중 하나로 색상, 크기, 방향, 조도, 위치 등 다양한 변화가 있는 상태에서 물체를 즉각적으로 정확하게 인식하는 것을 말합니다. 간단히 말해서 복잡한 장면에서 순식간에 물체를 식별할 수 있게 해줍니다. 수십 년 동안 이 주제에 대한 연구가 있었음에도 불구하고 뇌가 어떻게 물체의 불변적인 표현을 구성하는지에 대해서는 알려진 바가 거의 없습니다.

Is the way computer vision works similar to human vision?

컴퓨터 비전 자체의 아이디어는 컴퓨터나 기계에 인간의 시각과 똑같이 시각 정보를 획득, 분석 및 처리하고 시각 데이터에서 의미 있는 정보를 도출할 수 있는 능력을 부여하는 것입니다.

What is the main difference between computer vision and computer graphics?

컴퓨터 비젼과 컴퓨터 그래픽스는 서로 다른 표현으로 시각 정보를 처리합니다. 그러나 컴퓨터 그래픽스는 이미지 데이터를 사용하여 이미지 데이터를 생성하고 컴퓨터 그래픽스는 이미지 데이터를 사용하여 3D 모델을 생성합니다.

Food for thought

단순한 기계 작업의 경우, 기계로 하여금 우리의 많은 일을 하게 하는 것은 특별히 어렵지 않습니다. 하지만 더 복잡한 일의 경우, 기계는 인간의 시각을 제공받아야 합니다. 컴퓨터의 시각은 인간의 시각이 사물을 인식하는 방식과 비슷하게, 컴퓨터가 주변을 감지하고 사물을 식별하도록 하는 능력을 의미합니다.

컴퓨터 비전은 인간의 뇌가 작동하고 기능하는 방식을 모방하려고 노력하는 것입니다. 인공 신경망(ANN)은 인간 뇌의 기능을 복제하도록 설계된 컴퓨터 시스템입니다. 목표는 인간의 시각이 하는 것과 같이 컴퓨터에 시각 정보를 획득하고, 분석하고 처리할 수 있는 능력을 주는 것입니다. 그러나 뇌와 눈은 지금까지 유난히 복잡한 기관이기 때문에 이 기술은 인간의 몸이 수행할 수 있는 것 근처에도 없습니다. 우리 뇌의 신경 조직의 최대 50%가 직간접적으로 시각과 관련이 있고 우리의 신경 활동의 66% 이상이 시각 처리에만 관여하는 컴퓨터의 능력을 훨씬 뛰어 넘습니다.

세상은 아직 기계로만 운영되지는 않을 것으로 보이지만, 그 기술은 그곳에 있고 컴퓨터 비전과 인공지능 분야에서 점점 더 많은 학습이 개발되고 있습니다. 인간의 뇌가 기계 안에서 완전히 복제될 수 있을 때까지, 우리는 컴퓨터가 우리의 삶을 조금 더 쉽게 만드는 것을 계속해서 돕도록 허용하고 있습니다.

profile
존경하는 인물: 스토브리그 백승수 단장(남궁민)

0개의 댓글