global min값에 도달하는 parameter w의 값을 찾기 위해서 learning_rate\*dw값을 조금씩 빼 주는 이유는 무엇일까? 우리는 cost function을 알고 있어서 바로 구할 수 있는데도 말이다.위의 곡선과 같이 convex형태의 cost fu