0과 1, 즉 참과 거짓을 구분하는 가장 기초적인 인공 신경망 모델로, 특히 선형적으로 분리 가능한 문제 해결에 사용됩니다.
퍼셉트론은 뉴런 하나를 흉내 내는 모델로, 오늘날 딥러닝의 출발점이다.
퍼셉트론은 아래 과정을 거쳐 출력을 만듭니다.
입력값 → 가중치 곱함 → 전부 더함 → 편향 더함 → 활성화 함수 → 결과 출력
입력값(𝑥1,𝑥2) : 모델에 주어지는 데이터
가중치(w1,w2): 각 입력이 결과에 미치는 영향력(중요도)을 조절하는 거
편향 (𝑏): 퍼셉트론이 활성화되는 기준을 조정하는 값
출력값 (𝑦): 퍼셉트론이 최종적으로 도출하는 결과
입력값이 여러 개일 때 퍼셉트론의 출력은 이렇게 표현할 수 있습니다:
또는 이렇게 벡터로 정리할 수도 있죠:
쉽게 말해,
입력값 × 가중치 + 편향 → 활성화 함수 → 결과
이렇게 흘러가는 구조이다.
![]() |
![]() |
![]() |
이 세 동물 중에서, 누가 가장 귀여운지 판단해보자.
입력값: 귀여움을 판단하는 요소 (털의 부드러움, 눈의 반짝임 등)
→ 간단하게 모두 0.5로 통일
가중치: 동물마다 다르게 줌 (얼마나 귀여운지 평가하는 기준)
편향(bias): 기준을 조금 더 엄격하게 조정하는 값이라고 생각
→ 여기선 𝑏 = -0.1
퍼셉트론 계산식
활성화 함수: 계단 함수 사용 (임계값 1 이상이면 1, 아니면 0)
🐹 햄스터: 0.65 →0
🐱 고양이: 0.9 →0
🐶 강아지: 1.15 →1
따라서 귀엽다고 판단되는 건 강아지뿐이다!

위 그림에서 퍼셉트론이 AND, OR, NAND와 같은 논리 게이트를 처리할 수 있음을 알 수 있습니다.
하지만 XOR(배타적 논리합)과 같이 선형적으로 분리할 수 없는 문제는 어떻게 해야 할까?
이 그림처럼 하나의 직선으로 데이터를 나눌 수 없다.
이는 단일 퍼셉트론의 한계입니다.
그럼 이걸 어떻게 해결하냐?

위 그림처럼 곡선 형태로는 데이터를 나눌 수 있습니다. 이러한 한계를 극복하기 위해 등장한 것이 바로 다층 퍼셉트론입니다.
여러 개의 퍼셉트론을 층(layer)으로 쌓은 구조
[입력층] → [은닉층] → [출력층]
이는 퍼셉트론의 한계를 보완한 '업그레이드된 퍼셉트론'이라고 생각할 수 있다.
중간 계산기 또는 복잡한 조건을 처리하는 뇌 속 중간 처리 시스템과 같은 역할을 한다.
은닉층은 왜 필요할까?
단일 퍼셉트론이 해결할 수 없는 비선형 문제를 풀기 위해서입니다.

만약 사람이 직선으로만 그림을 그려야 한다면, 완벽하고 부드러운 원을 그리기 어려울 것입니다. 하지만 곡선을 자유롭게 사용할 수 있다면, 훨씬 부드럽고 정확한 원을 그릴 수 있게 됩니다.
이처럼 은닉층은 모델이 더욱 복잡하고 비선형적인 관계를 학습할 수 있도록 돕는 역할을 한다.
퍼셉트론은 결과를 '0 또는 1'로 판단하며, 데이터를 하나의 직선으로 구분할 수 있는 문제를 해결하는 가장 기본적인 인공신경망이다.
다층 퍼셉트론(MLP)은 이러한 직선만으로는 나눌 수 없는 복잡한 문제들까지도 학습하여 더 다양한 결과를 예측하고 판단할 수 있는 발전된 모델이다.