장점 : 가중치 매개변수 값을 작게하여 오버피팅이 일어나지 않음.
단점 : 값이 중요한 값이면 가중치를 크게 줘야하는데, 무조건 작게 나오면 그 값이 반영이 안되서 안좋은 결과를 도출할 수 있음.
모든 hidden layer들이 같은, 또는 대칭적인 가중치 값을 갖는다면 모든 노드의 활성화 함수에 같은, 또는 대칭적인 입력값이 들어간다는 뜻이고, 그러면 나중 역전파 때 모든 가중치의 값이 똑같이 갱신되기 때문에 가중치를 여러 개 둔 의미가 없어짐. 즉, 한 layer의 노드들이 모두 같은 일을 하기 때문에 노드의 낭비가 발생함.
-가중치가 0이면 변화가 없다는 것 -> 해당값을 계속 갖게 됨