다변수에서의 미분 가능성

zeta_xiv·2025년 2월 13일

다변수에서는 정의역이 직선이 아니므로 "미분 가능함"을 정의하는데 더 많은 것들이 필요하다. 2차원에서 정의된 함수 z=f(x,y)z=f(x,y)의 모양이 3차원 공간에 펼쳐지게 된다면 편미분을 정의할 때 xzxzyzyz 평면으로 절단해서 절단면에서의 곡선에 대하여 그 기울기를 살펴보는 것으로 생각할 수 있다. 그런데 이 상황에서 함수가 "미분 가능"하려면 이러한 절단면이 정확하게 xx 혹은 yy축에 평행하지 않고 약간 비껴간 상태에서도 "기울기"가 잘 정의될 수 있어야 합리적일 것이다. 그러나 앞의 글에 나온 예제와 같이, 원래의 xx 혹은 yy축에 대한 편미분의 존재성이 약간 비껴간 절단면에서도 기울기가 정의된다는 것을 보장해주지 않는다. 즉 특정한 좌표축에 의존하는 f/x\partial f / \partial xf/y\partial f / \partial y의 존재성만으로는 미분 가능성을 정의하기에 충분하지 않은 것이다.

1차원 함수에서 함수 y=f(x)y=f(x)가 불연속이거나 특정한 점 x0x_0 근처에서 함수의 모양이 뾰족할 경우 미분이 가능하지 않았다. 다시 말해서 1차원 함수를 무한히 확대했을 때 함수의 그래프가 일직선에 무한히 가깝게 되는 경우를 미분 가능하다고 했던 것이다. 2차원 함수 f:R2Rf:\mathbb{R}^2\rightarrow\mathbb{R}에서도 유사한 성질이 필요한데, 특정한 점 (x0,y0)(x_0, y_0) 근처에서의 약간의 변화가 급작스러운 변화를 일으키지 않아야 "미분이 가능하다"는 취지에 부합할 것이다. 이를 기하학적으로 표현하면 함수를 (x0,y0)(x_0, y_0) 근처로 무한히 확대했을 때 함수의 그래프 z=f(x,y)z=f(x,y)가 평면에 무한히 가깝게 되는 경우를 미분 가능하다고 할 수 있을 것이다. 이러한 평면을 "접평면(tangent plane)"이라 부른다. 나중에 보이겠지만, f:R2Rf:\mathbb{R}^2\rightarrow\mathbb{R}가 미분 가능할 때, 그래프 z=f(x,y)z=f(x,y)(x0,y0)(x_0, y_0)에서의 접평면은

z=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)z = f(x_0, y_0)+f_x(x_0, y_0)(x-x_0)+f_y(x_0, y_0)(y-y_0)

와 같이 주어진다.

1차원 함수에서 y=f(x)y=f(x)x=x0x=x_0에서 미분 가능하다면 xxx0x_0에서 x0+Δxx_0+\Delta x까지 변화하는 동안 대응되는 yy의 변화 Δy=f(x0+Δx)f(x0)\Delta y = f(x_0+\Delta x)-f(x_0)Δx\Delta x가 작을 수록 접선 위에서의 선형 근사 ΔL=f(x0)Δx\Delta L =f'(x_0)\Delta x에 가까워진다. 다시 말해서, 두 양의 차이

error=ΔyΔL=f(x0+Δx)f(x0)f(x0)Δx=(f(x0+Δx)f(x0)Δxf(x0))Δx=εΔx\begin{aligned} \text{error} &= \Delta y - \Delta L\\ &= f(x_0+\Delta x)-f(x_0) - f'(x_0)\Delta x\\ &= \left(\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}-f'(x_0)\right)\Delta x =\varepsilon\Delta x \end{aligned}

에서, Δx0\Delta x\rightarrow 0일 때 ε0\varepsilon\rightarrow 0이다. 즉, y=f(x)y=f(x)x=x0x=x_0에서 미분 가능하다면 xxx0x_0에서 x0+Δxx_0+\Delta x까지 변화하는 동안 대응되는 yy의 변화 Δy\Delta y

Δy=f(x0)Δx+εΔx\Delta y = f'(x_0)\Delta x+\varepsilon\Delta x

로 주어지며, 여기서 Δx0\Delta x\rightarrow 0일 때 ε0\varepsilon\rightarrow 0이다.

이 결과를 2차원으로 확장하면 2차원에서의 미분 가능성을 정의할 수 있다.

(Definition) 함수 z=f(x,y)z=f(x,y)에 대하여 점 (x0,y0)(x_0, y_0)에서의 편미분 fx(x0,y0)f_x(x_0, y_0)fy(x0,y0)f_y(x_0, y_0)가 존재하고 순간 변화 Δz=f(x0+Δx,y0+Δy)f(x0,y0)\Delta z = f(x_0+\Delta x, y_0+\Delta y)-f(x_0, y_0)

Δz=fx(x0,y0)Δx+fy(x0,y0)Δx+ε1Δx+ε2Δy\Delta z = f_x(x_0, y_0)\Delta x+f_y(x_0, y_0)\Delta x + \varepsilon_1\Delta x + \varepsilon_2\Delta y

로 표현되며 이때 Δx,Δy0\Delta x, \Delta y\rightarrow 0이면 ε1,ε20\varepsilon_1, \varepsilon_2\rightarrow 0일 때, f(x,y)f(x,y)(x0,y0)(x_0, y_0)에서 "미분 가능하다"라고 한다.

앞의 글에서 함수 f(x,y)f(x,y)(x0,y0)(x_0, y_0)에서 연속이 되는 의미를 정의했다. 이제 위 정의로부터 바로 다음 결과를 얻는다.

(Theorem) 함수 f(x,y)f(x,y)(x0,y0)(x_0, y_0)에서 미분 가능하면 (x0,y0)(x_0, y_0)에서 연속이다.
Proof) 미분 가능성의 정의로부터 자명하다. ■

한편, 함수 f(x,y)f(x,y)가 연속이고 fxf_xfyf_y가 열린 공간에서 연속이면 f(x,y)f(x,y)는 열린 공간에서 미분 가능하다. 즉 미분 가능이 되기 위한 필요 충분 조건은 각 편미분이 연속이어야 된다는 것이다:

(Theorem) (증가 정리) 점 (x0,y0)(x_0, y_0)을 포함하는 열린 공간 RR에 대하여 함수 f(x,y)f(x,y)의 편미분 fxf_x, fyf_yRR에서 정의되고 fxf_x, fyf_y(x0,y0)(x_0, y_0)에서 연속이면 변화 Δz=f(x0+Δx,y0+Δy)f(x0,y0)\Delta z=f(x_0+\Delta x, y_0+\Delta y)-f(x_0, y_0)

Δz=fx(x0,y0)Δx+fy(x0,y0)Δx+ε1Δx+ε2Δy\Delta z = f_x(x_0, y_0)\Delta x+f_y(x_0, y_0)\Delta x + \varepsilon_1\Delta x + \varepsilon_2\Delta y

으로 나타낼 수 있으며, 이때 Δx,Δy0\Delta x, \Delta y\rightarrow 0이면 ε1,ε20\varepsilon_1, \varepsilon_2\rightarrow 0이다.
Proof) 점 A(x0,y0)A(x_0, y_0)를 중심으로 하는 직사각형 영역 TRT\subset R를 생각하자. Δx\Delta x, Δy\Delta y가 충분히 작아서 B(x0+Δx,y0)B(x_0+\Delta x,y_0)C(x0,y0+Δy)C(x_0,y_0+\Delta y)가 모두 TT 안에 있다고 하자. 그러면 Δz\Delta z

Δz=f(x0+Δx,y0+Δy)f(x0,y0)=f(x0+Δx,y0+Δy)f(x0+Δx,y0)+f(x0+Δx,y0)f(x0,y0)=Δz2+Δz1\begin{aligned} \Delta z &= f(x_0+\Delta x, y_0+\Delta y)-f(x_0, y_0)\\ &= f(x_0+\Delta x, y_0+\Delta y)-f(x_0+\Delta x, y_0)+f(x_0+\Delta x, y_0)-f(x_0, y_0)\\ &= \Delta z_2 + \Delta z_1 \end{aligned}

로 쓸 수 있다. 여기서 Δz1=f(x0+Δx,y0)f(x0,y0)\Delta z_1=f(x_0+\Delta x, y_0)-f(x_0, y_0), Δz2=f(x0+Δx,y0+Δy)f(x0+Δx,y0)\Delta z_2=f(x_0+\Delta x, y_0+\Delta y)-f(x_0+\Delta x, y_0)이다. 이때 구간 [x0,x0+Δx][x_0, x_0+\Delta x]에서 F(x)=f(x,y0)F(x)=f(x,y_0)xx에 대하여 미분 가능하며, 따라서 중간값 정리에 의해

F(x0+Δx)F(x0)=F(c)Δxf(x0+Δx,y0)f(x0,y0)=fx(c,y0)Δx\begin{aligned} & F(x_0+\Delta x)-F(x_0)=F'(c)\Delta x\\ & \Rightarrow f(x_0+\Delta x,y_0)-f(x_0,y_0)=f_x(c,y_0)\Delta x \end{aligned}

를 만족하는 ccx0x_0x0+Δxx_0+\Delta x 사이에 존재한다. 마찬가지로, 구간 [y0,y0+Δy][y_0, y_0+\Delta y]에서 정의된 함수 G(y)=f(x0+Δx,y)G(y)=f(x_0+\Delta x,y)yy에 대하여 미분 가능하며,

f(x0+Δx,y0+Δy)f(x0+Δx,y0+Δx)=fy(x0+Δx,d)Δyf(x_0+\Delta x, y_0+\Delta y)-f(x_0+\Delta x,y_0+\Delta x)=f_y(x_0+\Delta x,d)\Delta y

를 만족하는 ddy0y_0y0+Δyy_0+\Delta y 사이에 존재한다. 여기서 Δx,Δy0\Delta x, \Delta y \rightarrow 0이면 cx0c\rightarrow x_0, dy0d\rightarrow y_0이다. 한편 fxf_xfyf_y(x0,y0)(x_0, y_0)에서 연속이므로 두 값

ε1=fx(c,y0)fx(x0,y0),ε2=fy(x0+Δx,d)fx(x0+Δx,y0)\begin{aligned} \varepsilon_1 &= f_x(c, y_0)-f_x(x_0,y_0)\,,\\ \varepsilon_2 &= f_y(x_0+\Delta x, d)-f_x(x_0+\Delta x,y_0) \end{aligned}

은 모두 Δx,Δy0\Delta x, \Delta y \rightarrow 0일 때 각각 00으로 수렴한다. 그러므로

Δz=fx(c,y0)Δx+fx(x0+Δx,d)Δy=[fx(x0,y0)+ε1]Δx+[fy(x0,y0)+ε2]Δy=fx(x0,y0)Δx+fy(x0,y0)Δy+ε1Δx+ε2Δy\begin{aligned} \Delta z &= f_x(c, y_0)\Delta x+f_x(x_0+\Delta x, d)\Delta y\\ &= [f_x(x_0, y_0)+\varepsilon_1]\Delta x+[f_y(x_0, y_0)+\varepsilon_2]\Delta y\\ &= f_x(x_0, y_0)\Delta x+f_y(x_0, y_0)\Delta y+\varepsilon_1\Delta x+\varepsilon_2\Delta y \end{aligned}

이며, 이때 Δx,Δy0\Delta x, \Delta y\rightarrow 0이면 ε1,ε20\varepsilon_1, \varepsilon_2\rightarrow 0이다. ■

이와 같은 결과는 고차원으로도 확장할 수 있다. 만약 3차원에서 정의된 함수 w=f(x,y,z)w=f(x,y,z)에 대하여 편미분 fxf_x, fyf_y, fzf_z가 점 (x0,y0,z0)(x_0, y_0, z_0)에서 존재하고 각각 (x0,y0,z0)(x_0, y_0, z_0)에서 연속이면 함수 ww의 순간 변화 Δw=f(x0+Δx,y0+Δy,z0+Δz)f(x0,y0,z0)\Delta w=f(x_0+\Delta x, y_0+\Delta y, z_0+\Delta z)-f(x_0, y_0, z_0)는 다음과 같이 나타낼 수 있다:

Δw=f(x0,y0,z0)xΔx+f(x0,y0,z0)yΔy+f(x0,y0,z0)zΔz+ε1Δx+ε2Δy+ε3Δz\begin{aligned} \Delta w =&\,\frac{\partial f(x_0, y_0, z_0)}{\partial x}\Delta x +\frac{\partial f(x_0, y_0, z_0)}{\partial y}\Delta y +\frac{\partial f(x_0, y_0, z_0)}{\partial z}\Delta z\\ &\quad+\varepsilon_1\Delta x +\varepsilon_2\Delta y +\varepsilon_3\Delta z \end{aligned}

이때 Δx,Δy,Δz0\Delta x, \Delta y, \Delta z\rightarrow 0이면 ε1,ε2,ε30\varepsilon_1, \varepsilon_2, \varepsilon_3\rightarrow 0이다.

0개의 댓글