문제 정의: 일반적인 신경망 레이어는 연속적인 값(예: 실수)을 출력합니다. 하지만, 일부 레이어는 이산적인 출력(예: 0 또는 1)을 생성합니다. 이산 출력은 미분이 불가능하기 때문에, 기존의 역전파 방식을 사용하여 그래디언트를 계산하는 것이 어렵습니다.
STE의 역할: STE는 이산적인 레이어의 역전파 문제를 해결합니다. 순전파 단계에서는 정상적으로 이산화된 출력을 생성합니다. 하지만 역전파 단계에서는, 이산화 과정이 마치 연속적인 함수처럼 행동하는 것처럼 가정하여 그래디언트를 계산합니다.
실제 구현: 예를 들어, 신경망 레이어의 출력이 특정 임계값을 기준으로 0 또는 1로 이산화됩니다. 순전파에서는 이 임계값에 따라 출력이 결정됩니다. 역전파에서는 이 이산화 과정을 무시하고, 원래의 연속적인 출력 값에 대한 그래디언트를 그대로 사용합니다.