ReLU와 선형 함수의 특성: Additivity와 Homogeneity의 불만족

Bean·2025년 4월 24일
0

수학

목록 보기
7/13

1. 선형 함수의 특성 (Additivity와 Homogeneity):

  1. Additivity (가법성):
    선형 함수 f(x)두 입력의 합에 대해 함수의 값을 합산할 수 있는 특성을 가집니다. 즉, f(x + y) = f(x) + f(y)이어야 합니다.

  2. Homogeneity (동차성):
    선형 함수 f(x)입력을 일정 배수로 늘리면, 함수 값도 그 배수만큼 커져야 하는 특성을 가집니다. 즉, f(λx) = λf(x)이어야 합니다. 여기서 λ는 스칼라입니다.


2. 비선형 함수:

  • 비선형 함수additivityhomogeneity 특성을 만족하지 않습니다.
  • 예를 들어, ReLU(x) = max(0, x) 함수는 x가 양수일 때는 선형이지만, x가 음수일 때는 출력을 항상 0으로 만들어버립니다. 그래서 이 함수는 가법성이나 동차성을 만족하지 않기 때문에 비선형이라고 할 수 있습니다.

2.1. ReLU와 비선형성:

  • ReLU(x)x > 0일 때 출력값이 x와 같고 선형적인 형태를 따릅니다.

  • 그러나 x ≤ 0일 때출력값이 항상 0이 되어, 입력값에 대한 출력이 비선형적으로 바뀝니다. 즉, 0을 기준으로 갑자기 변화가 생기기 때문에 ReLU 함수는 비선형적입니다.

    • 예를 들어, ReLU(x + y)ReLU(x) + ReLU(y)와 항상 일치하지 않으며, 이는 가법성을 만족하지 않음을 의미합니다.
    • 또한 ReLU(λx)λReLU(x)와 일치하지 않으며, 이는 동차성을 만족하지 않음을 의미합니다.

3. 비선형성의 예시

3.1. ReLU 함수:

ReLU(x)=max(0,x)\text{ReLU}(x) = \max(0, x)

즉, x가 0보다 크면 x를 출력하고, x가 0보다 작으면 0을 출력하는 함수입니다.

3.1.2. Additivity (가법성):

가법성은 두 입력값의 합에 대해 함수가 그 합의 결과를 함수 적용 후의 결과들의 합과 같아야 한다는 특성입니다.

즉, f(x+y)=f(x)+f(y)f(x + y) = f(x) + f(y)가 성립해야 합니다.

ReLU 함수로 확인해봅시다:

예를 들어, x=1x = -1, y=2y = 2일 때:

  • ReLU(x+y)=ReLU(1+2)=ReLU(1)=1ReLU(x + y) = ReLU(-1 + 2) = ReLU(1) = 1
  • ReLU(x)+ReLU(y)=ReLU(1)+ReLU(2)=0+2=2ReLU(x) + ReLU(y) = ReLU(-1) + ReLU(2) = 0 + 2 = 2

여기서, ReLU(x+y)ReLU(x)+ReLU(y)ReLU(x + y) ≠ ReLU(x) + ReLU(y)입니다.

왜 그런지 살펴보면:

  • x+y=1x + y = 1일 때 ReLU(1)=1ReLU(1) = 1이지만,
  • 개별적으로 ReLU(x)=0ReLU(x) = 0 (x는 음수이므로)와 ReLU(y)=2ReLU(y) = 2 (y는 양수이므로)로 나뉘어 계산했을 때 그 합은 22가 나옵니다.

따라서 ReLU 함수는 가법성을 만족하지 않습니다.

3.1.3. Homogeneity (동차성):

동차성은 함수가 입력값에 스칼라 λλ를 곱한 값에 대해 함수의 출력값이 그 스칼라 λλ만큼 곱해지는 특성을 의미합니다.

즉, f(λx)=λf(x)f(λx) = λf(x)가 성립해야 합니다.

ReLU 함수로 확인해봅시다:

예를 들어, x=1x = -1, λ=2λ = 2일 때:

  • ReLU(λx)=ReLU(21)=ReLU(2)=0ReLU(λx) = ReLU(2 * -1) = ReLU(-2) = 0
  • λReLU(x)=2ReLU(1)=20=0λ * ReLU(x) = 2 * ReLU(-1) = 2 * 0 = 0

여기서는 두 결과가 일치하지만, 다른 예를 들어봅시다.

x=1x = 1, λ=2λ = -2일 때:

  • ReLU(λx)=ReLU(21)=ReLU(2)=0ReLU(λx) = ReLU(-2 * 1) = ReLU(-2) = 0
  • λReLU(x)=2ReLU(1)=21=2λ * ReLU(x) = -2 * ReLU(1) = -2 * 1 = -2

여기서는 ReLU(λx)=0ReLU(λx) = 0인데 λReLU(x)=2λ * ReLU(x) = -2로 결과가 다릅니다.

따라서 ReLUReLU 함수는 동차성을 만족하지 않습니다.


4. 결론:

  • AdditivityHomogeneity선형 함수의 두 중요한 특성인데, ReLUReLU는 이 두 특성을 만족하지 않기 때문에 비선형 함수입니다.
  • ReLUReLU입력값에 따라 갑자기 변화가 일어나기 때문에, 그 함수의 동작이 선형적이지 않습니다.
profile
AI developer

0개의 댓글