기초 미분
f′(x)=dxdy=h→0limhf(x+h)−f(x)
f(x)=x2+2x+3f′(x)=2x+2
미분법칙
-
합의법칙 (f(x)+g(x))′=f′(x)+g′(x)
-
곱의법칙 (f(x)g(x))′=f′(x)g(x)+f(x)g′(x)
-
연쇄법칙 (f(g(x)))′=f′(g(x))g′(x)
-
몫의 법칙 (g(x)f(x))′=g2(x)f′(x)g(x)−f(x)g′(x)
-
y=ex→y′=ex
편미분 ∂(round)
여러 변수들 중 하나에 대해서 미분하고, 나머지는 상수로 취급
∂x∂f(x,y,...)
f(x,y)=fy(x)=x2+xy+y2
x에 대한 편미분을 구하면 다음과 같다.
y는 상수처럼 취급해서, y의 제곱은 상수니깐 0이 되고 x의 제곱은 2x가 되고 xy에서 y는 상수취급이 되어 y만 남게 되어 다음과 같이 된다.
∂x∂f(x,y)=2x+y
이를 기반으로
z=(x+y)2∂x∂z=?
z를 x에 대해 편미분하게 되면 (x+y)를 우선 w로 치환하면 z=w2, w=(x+y) 두가지를 얻을 수 있다.
∂w∂z=2w
∂x∂w=1
∂x∂z=∂w∂z∂x∂w=2w∗1=2(x+y)
를 구할 수 있다.
x+f′(x)<x 는 x가 왼쪽으로 이동해서 값이 증가
( ※ x + (-미분값) = x 보다 작으므로 왼쪽으로 이동하는데 미분값이 음수이므로 함수값은 증가 라는 뜻 )
x+f′(x)>x 는 x가 오른쪽으로 이동해서 값이 증가
x−f′(x)<x 는 x가 왼쪽으로 이동해서 값이 감소
x−f′(x)>x 는 x가 오른쪽으로 이동해서 값이 감소
결론
- 미분값을 더해주면 함수값을 최대화 (Gradient Ascent)
- 미분값을 빼주면 함수값을 최소화 (Gradient Descent)