퍼셉트론

김지현·2025년 7월 29일

퍼셉트론이란?

0과 1, 즉 참과 거짓을 구분하는 가장 기초적인 인공 신경망 모델로, 특히 선형적으로 분리 가능한 문제 해결에 사용됩니다.

퍼셉트론은 뉴런 하나를 흉내 내는 모델로, 오늘날 딥러닝의 출발점이다.

퍼셉트론 작동 원리

퍼셉트론은 아래 과정을 거쳐 출력을 만듭니다.

 입력값 → 가중치 곱함 → 전부 더함 → 편향 더함 → 활성화 함수 → 결과 출력

1. 퍼셉트론 구성 요소

입력값(𝑥1,𝑥2) : 모델에 주어지는 데이터
가중치(w1,w2): 각 입력이 결과에 미치는 영향력(중요도)을 조절하는 거
편향 (𝑏): 퍼셉트론이 활성화되는 기준을 조정하는 값
출력값 (𝑦): 퍼셉트론이 최종적으로 도출하는 결과

수식으로 표현하면?

입력값이 여러 개일 때 퍼셉트론의 출력은 이렇게 표현할 수 있습니다:

y=f(i=1dwixi+b)y = f\left( \sum_{i=1}^{d} w_i x_i + b \right)

또는 이렇게 벡터로 정리할 수도 있죠:

y=f((x1,x2)(w1,w2)+b)y = f\big( (x_1, x_2) \cdot (w_1, w_2) + b \big)

쉽게 말해,

입력값 × 가중치 + 편향 → 활성화 함수 → 결과

이렇게 흘러가는 구조이다.

1-2. 퍼셉트론 예시: 귀여움을 판단하는 AI

이 세 동물 중에서, 누가 가장 귀여운지 판단해보자.

입력값: 귀여움을 판단하는 요소 (털의 부드러움, 눈의 반짝임 등)
→ 간단하게 모두 0.5로 통일

가중치: 동물마다 다르게 줌 (얼마나 귀여운지 평가하는 기준)

가중치:{햄스터:w=1.5고양이:w=2.0강아지:w=2.5\text{가중치:} \quad \begin{cases} \text{햄스터}: w = 1.5 \\ \text{고양이}: w = 2.0 \\ \text{강아지}: w = 2.5 \end{cases}
편향 (모든 동물 공통):b=0.1\text{편향 (모든 동물 공통):} \quad b = -0.1

편향(bias): 기준을 조금 더 엄격하게 조정하는 값이라고 생각
→ 여기선 𝑏 = -0.1

퍼셉트론 계산식

y=f(0.5×w+b)y = f(0.5 \times w + b)
{y햄스터=f(0.5×1.50.1)=f(0.65)y고양이=f(0.5×2.00.1)=f(0.9)y강아지=f(0.5×2.50.1)=f(1.15)\begin{cases} y_{\mathrm{햄스터}} = f(0.5 \times 1.5 - 0.1) = f(0.65) \\ y_{\mathrm{고양이}} = f(0.5 \times 2.0 - 0.1) = f(0.9) \\ y_{\mathrm{강아지}} = f(0.5 \times 2.5 - 0.1) = f(1.15) \end{cases}

활성화 함수: 계단 함수 사용 (임계값 1 이상이면 1, 아니면 0)

f(z)={1,z10,z<1f(z) = \begin{cases} 1, & z \geq 1 \\ 0, & z < 1 \end{cases}

🐹 햄스터: 0.65 →0
🐱 고양이: 0.9 →0
🐶 강아지: 1.15 →1

따라서 귀엽다고 판단되는 건 강아지뿐이다!

2.활용


위 그림에서 퍼셉트론이 AND, OR, NAND와 같은 논리 게이트를 처리할 수 있음을 알 수 있습니다.

하지만 XOR(배타적 논리합)과 같이 선형적으로 분리할 수 없는 문제는 어떻게 해야 할까?
이 그림처럼 하나의 직선으로 데이터를 나눌 수 없다.
이는 단일 퍼셉트론의 한계입니다.

그럼 이걸 어떻게 해결하냐?

위 그림처럼 곡선 형태로는 데이터를 나눌 수 있습니다. 이러한 한계를 극복하기 위해 등장한 것이 바로 다층 퍼셉트론입니다.

다층 퍼셉트론(MLP)

여러 개의 퍼셉트론을 층(layer)으로 쌓은 구조

[입력층] → [은닉층] → [출력층]

이는 퍼셉트론의 한계를 보완한 '업그레이드된 퍼셉트론'이라고 생각할 수 있다.

은닉층

중간 계산기 또는 복잡한 조건을 처리하는 뇌 속 중간 처리 시스템과 같은 역할을 한다.

은닉층은 왜 필요할까?
단일 퍼셉트론이 해결할 수 없는 비선형 문제를 풀기 위해서입니다.

예시

만약 사람이 직선으로만 그림을 그려야 한다면, 완벽하고 부드러운 원을 그리기 어려울 것입니다. 하지만 곡선을 자유롭게 사용할 수 있다면, 훨씬 부드럽고 정확한 원을 그릴 수 있게 됩니다.

이처럼 은닉층은 모델이 더욱 복잡하고 비선형적인 관계를 학습할 수 있도록 돕는 역할을 한다.

요약

퍼셉트론은 결과를 '0 또는 1'로 판단하며, 데이터를 하나의 직선으로 구분할 수 있는 문제를 해결하는 가장 기본적인 인공신경망이다.

다층 퍼셉트론(MLP)은 이러한 직선만으로는 나눌 수 없는 복잡한 문제들까지도 학습하여 더 다양한 결과를 예측하고 판단할 수 있는 발전된 모델이다.

profile
강한 긍정으로 사람들에게 힘이 되어주고 싶은 사람입니다.

0개의 댓글