사람의 신경망과 인공신경망 비교
사람 신경망 | 인공 신경망 |
---|---|
세포체 | 노드 |
수상돌기 | 입력 |
축삭 | 출력 |
시냅스 | 가중치 |
절(node), 가중치(weight), 층(layer)과 같은 새로운 개념의 구조 도입, 학습 알고리즘 제안
입력
- i번째 노드는 특징 벡터 의 요소 를 담당
- 항상 1이 입력되는 편향(bias)(임계값을 구분하는 계단 함수를 0점에서부터 비교할 수 있도록 만드는 역할) 노드를 포함
연산
- 번째 입력 노드와 출력 노드를 연결하는 변(edge)은 가중치 를 가짐
- 퍼셉트론은 단일 층 구조라고 간주
출력
- 한 개의 노드에 의해 수치(+1 혹은 -1) 출력
퍼셉트론의 동작
- 선형 연산 → 비선형 연산
- 선형: 입력(특징)값과 가중치를 곱하고 모두 더해 (스칼라)를 구함
- 비선형: 활성함수 를 적용
- 활성함수로 계단 함수를 사용 → 출력 혹은
일반적인 분류기의 학습 과정
- 단계 1: 과업의 정의와 분류 과정의 수학적 정의(가설 설정)
- 단계 2: 해당 분류기의 목적함수 정의
- 단계 3: 를 최소화하는 \theta를 찾기 위한 최적화 방법 수행
목적함수 정의
- 퍼셉트론의 매개변수를 라 표기하면, 매개변수 집합은
- 목적함수를 또는 로 표기
퍼셉트론 목적함수의 상세 조건
- 이다.
- 가 최적이면, 즉 모든 샘플을 맞히면 이다.
- 틀리는 샘플이 많은 일수록 는 큰 값을 가진다.
목적함수 상세 설계
- 임의의 샘플 가 에 속한다면, 퍼셉트론의 예측 값 와 실제 값 는 부호가 다르므로 는 항상 양수
- 결국 가 클수록(틀린 샘플이 많을수록), 는 큰 값을 가짐
- 가 공집합일 때(즉 퍼셉트론이 모든 샘플을 맞출 때),
최소 기울기를 이용하여 반복 탐색하여 극값을 찾음
stochastic ver.
batch ver.
훈련집합의 샘플을 모두 맞출 때까지 세대(epoch)를 반복(3~9번째 줄)