[컴퓨터비전] Human Vision

유진·2025년 4월 7일

인간의 시각

인간의 눈: 오감 중에 시각은 가장 강력한 인지 기능
사람이 획득하는 대부분의 정보는 시각을 통해 얻어짐
사람은 장면을 보면 해다 장면에 대한 구체적인 해석이 가능
인간의 시각 정보 처리 체계는 빠르고 효율적임

우리는 해당 사진을 보고 아이가 킥보드를 타다가 넘어졌다고 추론할 수 있지만, 컴퓨터는 킥보드 옆에 아이가 앉아있다고 할 가능성이 높음
-> 컴퓨터가 인간처럼 장면을 해석할 수 없었음

Human Visual PathWay

  1. 각막(cornea)을 통해 들어온 빛 에너지가 홍채와 수정체를 통해 빛의 양과 초점의 위치를 조절하여 눈의 내부로 전달
  2. 눈의 내부로 들어온 빛은 망막(retina)에 상이 맺힘
  3. 망막에서는 간상체(rod)와 원추체(cone)라는 수용기를 통해 빛에너지를 전기적 에너지로 바꾸어 신경절 세포로 전달
  4. 신경절 세포를 통해 눈 밖으로 나온 신경 충격은 시신경을 따라 머리 중심쪽에 위치한 외측슬상핵이라는 신경핵에 도착
  5. 시각 피질 혹은 시각 수용 영역이라고 하는 대뇌피질의 후두엽으로 흘러감

Human Retina

Photoreceptor(시세포=rods&cones)
망막 상의 작은 영역의 빛 강도 검출
cone
망막의 중심에 위치
RGB에 반응, 세밀한 영상감지(고해상도)
rod
망막 표면에 넓게 분포
명암만 구별, 순간 움직임, 순간대상(저해상도)

Ganglion Cell(신경절 세포)
대역 통과형 필터의 기능 (패턴 크기에 선택적 반응)
빛의 변화 감지

Receptive Field

수용야
시야 내의 특정 시각 자극에 반응하는 수용 영역
해당 영역의 특정 특징에 대해서만 반응함
On-Center/Off-Surround 수용야
자극이 중심영역에 들어왔을 때 흥분(민감하게 처리)
주변 영역에 들어왔을 때 억제
Off-Center/On-Surround 수용야
자극이 중심영역에 들어왔을 때 억제
주변 영역에 들어왔을 때 흥분

On Center cell Off center cell
중앙에만 빛 반응O 반응X
주변에만 빛 반응X 반응O
빛 X 반응X 반응X
주변+중앙 빛 약한 반응 약한 반응

2번째의 경우 -+- (off-on-off) -> 약한 반응 or 반응X
3번재의 경우 on -> 반응O

특정 위치와 방향에 따라 반응하는 것이 다름

Lateral Inhibition

측면억제
한 뉴런이 활성화될 때 주변 뉴런의 활동을 억제하는 과정
-> 자극이 강한 부분과 약한 부분 사이의 대비가 더욱 뚜렷해 짐

시각에서 측면 억제의 역할

경계 강조, 명암 대비, 감각 정밀도를 높이는 효과
CNN에서 경계 검출 및 이미지 인식 성능을 향상하는데 활용

LGN

외측슬상핵
망막(Retina)에서 받은 신호를 대뇌 피질의 시각 피질로 전달
좌우에 각각 1개씩 6개의 층으로 구성
각 층은 서로 다른 유형의 시간 정보를 담당
Attention - 중요한 정보에 더 초점을 맞추도록 조절
양안 정보의 정렬 및 분리 - 깊이 인식 수행

1-2층 (Magnocellular, M-세포 경로)
동작, 밝기 변화 정보를 처리
큰 신경세포로 구성되어 빠른 반응을 보이며, 움직임 감지에 특화(저해상도)
3-4-5-6층 (Parvocellular, P-세포 경로)
색, 정적인 디테일, 고해상도 정보를 처리
작은 신경세포로 구성되어 있으며, 색상과 형태 인식에 특화(고해상도)
Koniocellular층 (K세포 경로, M-P층 사이에 존재)**
색상 대비 및 특정 시각적 특성 처리에 관여

Visual Cortex

대뇌시각피질
대뇌 피질에서 시각 정보를 처리하는 영역
후두엽에 위치
최종적으로 시각 정보를 해석하고 인식
V1
망막과 시상의 LGN에서 오는 정보를 최초로 처리하는 영역
V2-V5
V1에서 받은 정보를 심화 분석하는 2차 시각 피질
V2: 형태 및 경계를 분석
V3: 동적 객체의 형태 인식
V4: 색상 및 복잡한 형태 처리
V5/MT: 움직임 감지

Primary visual Cortex

1차 시각 피질 (V1)
본질적으로 시각피질의 영역은 망막의 영역과 점대점 관계로 대표되어 있으나 1차 시각피질의 거의 절반은 망막의 중심과 영역을 대표하는 영역으로 되어있음
여러 종류의 특징에 반응하는 뉴런이 계층적으로 존재

Hubel&Wiesel의 연구

고등 포유동물의 시각피질의 뉴런이 시각적 형태를 어떻게 부호화(인코딩)하는지에 대한 수많은 정보 제공
시각 정보는 뇌에서 단순한 특징(선의 방향 등)에서 복잡한 특징(물체의 형태 등)으로 점차 처리됨

이후 경로

Where Path
M층 -> 두정엽으로 전달 : 대상의 위치
What Path
P층 -> 측두엽으로 전달 : 대상이 무엇인가

Human Visual System

강점
분류, 검출, 분할, 추적, 행동 분석에 능숙
3차원 복원 능력
빠르고 강건 -> 주변 제약이 적음
다른 지능 요소인 지식 표현, 추론, 계획과 협동
사전 행동에 능숙
과업 전환이 매끄럽고 유기적이고 빠름

Computer Vision이란?

컴퓨터 비전은 인간의 시각을 흉내 내는 컴퓨터 프로그램
인공지능의 중요한 구성 요소임
(시각 기능 로봇은 성능이 낮음)

0개의 댓글