Linear layer에 대한 설명 및 예시

Bean·2025년 4월 27일

인공지능

목록 보기

14/134

Linear layer(선형 레이어)는 인공지능 모델에서 입력을 받아 "한 번 곱하고 더하는" 역할을 합니다.
수학적으로는 다음처럼 표현할 수 있어요:

\text{output} = W \times \text{input} + b

쉽게 말하면, 입력값을 각각 가중치를 곱해서 더하고, 마지막에 편향을 추가하는 거예요.

—

예를 들면:

즉, Linear layer는
「입력 차원 → 출력 차원」으로 바꿔주는 "가장 기본적인 변환기"라고 보면 됩니다!

입력 벡터: $x = \begin{bmatrix} x_1 \\ x_2 \\ x_3 \\ x_4 \end{bmatrix} \quad (4 \text{차원})$
Linear layer: 입력 크기 4 → 출력 크기 2

즉, weight $W$ 는 (2×4) 크기이고, bias $b$ 는 (2×1) 크기입니다.

Weight matrix: $W = \begin{bmatrix} w_{11} & w_{12} & w_{13} & w_{14} \\ w_{21} & w_{22} & w_{23} & w_{24} \end{bmatrix}$
Bias vector: $b = \begin{bmatrix} b_1 \\ b_2 \end{bmatrix}$

Linear layer의 출력은 다음과 같이 계산됩니다:

y = W x + b

전개하면:

y = \begin{bmatrix} w_{11}x_1 + w_{12}x_2 + w_{13}x_3 + w_{14}x_4 + b_1 \\ w_{21}x_1 + w_{22}x_2 + w_{23}x_3 + w_{24}x_4 + b_2 \end{bmatrix}

즉,

이렇게 output feature 수 만큼 식이 생깁니다.

AI developer