多元复合函数偏导、泰勒公式、多元向量函数、方向导数与梯度

复合函数偏导

链式法则

设函数 u=φ(x),v=ψ(x)u = \varphi(x),\, v = \psi(x)xx 处可导,函数 z=f(u,v)z = f(u, v) 在点 (u,v)(u, v) 处可微,则复合函数 z=f(φ(x),ψ(x))z = f(\varphi(x), \psi(x)) 在点 xx 处可导,且有

 ⁣dz ⁣dx= ⁣z ⁣u ⁣du ⁣dx+ ⁣z ⁣v ⁣dv ⁣dx\dfrac{\d z}{\d x} = \dfrac{\pd z}{\pd u} \dfrac{\d u}{\d x} + \dfrac{\pd z}{\pd v} \dfrac{\d v}{\d x}

其中  ⁣dz ⁣dx\dfrac{\d z}{\d x} 称为全导数


证明:

对自变量 xx 有增量 Δx\Delta x,从而引起中间变量 u,vu,\, v 的增量分别为

Δu=φ(x+Δx)φ(x)Δv=ψ(x+Δx)ψ(x)\begin{aligned} \Delta u &= \varphi(x + \Delta x) - \varphi(x)\\ \Delta v &= \psi(x + \Delta x) - \psi(x) \end{aligned}

Δu=Δv=0\Delta u = \Delta v = 0,则 Δz=0\Delta z = 0,显然成立。

若二者不同时为零,由于 z=f(u,v)z = f(u, v) 可微,有

Δz= ⁣z ⁣uΔu+ ⁣z ⁣vΔv+o(ρ)\Delta z = \dfrac{\pd z}{\pd u} \Delta u + \dfrac{\pd z}{\pd v} \Delta v + o(\rho)

其中 ρ=(Δu)2+(Δv)2\rho = \sqrt{(\Delta u)^2 + (\Delta v)^2}

从而有

ΔzΔx= ⁣z ⁣uΔuΔx+ ⁣z ⁣vΔvΔx+o(ρ)Δx\dfrac{\Delta z}{\Delta x} = \dfrac{\pd z}{\pd u} \dfrac{\Delta u}{\Delta x} + \dfrac{\pd z}{\pd v} \dfrac{\Delta v}{\Delta x} + \dfrac{o(\rho)}{\Delta x}

Δx0\Delta x \to 0,已知 u=φ(x),v=ψ(x)u = \varphi(x),\, v = \psi(x) 可导,所以有

limΔx0ΔuΔx= ⁣du ⁣dxlimΔx0ΔvΔx= ⁣dv ⁣dx\begin{aligned} \lim_{\Delta x \to 0} \dfrac{\Delta u}{\Delta x} &= \dfrac{\d u}{\d x}\\ \lim_{\Delta x \to 0} \dfrac{\Delta v}{\Delta x} &= \dfrac{\d v}{\d x} \end{aligned}

由于 limΔx0Δu=0,limΔx0Δv=0\lim\limits_{\Delta x \to 0} \Delta u = 0,\, \lim\limits_{\Delta x \to 0} \Delta v = 0,所以有 limΔx0ρ=0\lim\limits_{\Delta x \to 0} \rho = 0,从而有

limΔx0o(ρ)Δx=limΔx0sign(Δx)o(ρ)ρ(Δu)2+(Δv)2(Δx)2=limΔx0sign(Δx)o(ρ)ρ(ΔuΔx)2+(ΔvΔx)2=( ⁣du ⁣dx)2+( ⁣dv ⁣dx)2limΔx0sign(Δx)o(ρ)ρ=0(前面根号和后面 sign 函数有界,而 o(ρ) 是 ρ 的高阶无穷小)\begin{aligned} \lim\limits_{\Delta x \to 0} \dfrac{o(\rho)}{\Delta x} &= \lim\limits_{\Delta x \to 0} \operatorname{sign}(\Delta x) \dfrac{o(\rho)}{\rho} \dfrac{\sqrt{(\Delta u)^2 + (\Delta v)^2}}{\sqrt{(\Delta x)^2}}\\ &= \lim\limits_{\Delta x \to 0} \operatorname{sign}(\Delta x) \dfrac{o(\rho)}{\rho} \sqrt{\left( \dfrac{\Delta u}{\Delta x} \right)^2 + \left( \dfrac{\Delta v}{\Delta x} \right)^2}\\ &= \sqrt{\left( \dfrac{\d u}{\d x} \right)^2 + \left( \dfrac{\d v}{\d x} \right)^2} \lim\limits_{\Delta x \to 0} \operatorname{sign}(\Delta x) \dfrac{o(\rho)}{\rho} \\ &= 0\quad (\text{前面根号和后面 $\operatorname{sign}$ 函数有界,而 $o(\rho)$ 是 $\rho$ 的高阶无穷小}) \end{aligned}

从而有

 ⁣dz ⁣dx= ⁣z ⁣u ⁣du ⁣dx+ ⁣z ⁣v ⁣dv ⁣dx\dfrac{\d z}{\d x} = \dfrac{\pd z}{\pd u} \dfrac{\d u}{\d x} + \dfrac{\pd z}{\pd v} \dfrac{\d v}{\d x}

设函数 u=φ(x,y),v=ψ(x,y)u = \varphi(x, y),\, v = \psi(x, y)(x,y)(x, y) 处可偏导,函数 z=f(u,v)z = f(u, v) 在点 (u,v)(u, v) 处可微,则复合函数 z=f(φ(x,y),ψ(x,y))z = f(\varphi(x, y), \psi(x, y)) 在点 (x,y)(x, y) 处可偏导,且有

 ⁣z ⁣x= ⁣z ⁣u ⁣u ⁣x+ ⁣z ⁣v ⁣v ⁣x ⁣z ⁣y= ⁣z ⁣u ⁣u ⁣y+ ⁣z ⁣v ⁣v ⁣y\begin{aligned} \dfrac{\pd z}{\pd x} &= \dfrac{\pd z}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd z}{\pd v} \dfrac{\pd v}{\pd x}\\ \dfrac{\pd z}{\pd y} &= \dfrac{\pd z}{\pd u} \dfrac{\pd u}{\pd y} + \dfrac{\pd z}{\pd v} \dfrac{\pd v}{\pd y} \end{aligned}


证明:

分别视 y,xy,\, x 为常数,运用上面的链式法则即得证。

设函数 u=φ(x,y),v=ψ(x,y)u = \varphi(x, y),\, v = \psi(x, y)(x,y)(x, y) 处可偏导,函数 f(x,y,u,v)f(x, y, u, v) 在点 (x,y,u,v)(x, y, u, v) 处可微,则复合函数 z=f(x,y,φ(x,y),ψ(x,y))z = f(x, y, \varphi(x, y), \psi(x, y)) 在点 (x,y)(x, y) 处可偏导,且有

 ⁣z ⁣x= ⁣f ⁣x+ ⁣f ⁣u ⁣u ⁣x+ ⁣f ⁣v ⁣v ⁣x ⁣z ⁣y= ⁣f ⁣y+ ⁣f ⁣u ⁣u ⁣y+ ⁣f ⁣v ⁣v ⁣y\begin{aligned} \dfrac{\pd z}{\pd x} &= \dfrac{\pd f}{\pd x} + \dfrac{\pd f}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd f}{\pd v} \dfrac{\pd v }{\pd x}\\ \dfrac{\pd z}{\pd y} &= \dfrac{\pd f}{\pd y} + \dfrac{\pd f}{\pd u} \dfrac{\pd u}{\pd y} + \dfrac{\pd f}{\pd v} \dfrac{\pd v }{\pd y} \end{aligned}

这里需要指出, ⁣f ⁣x\dfrac{\pd f}{\pd x} 的含义是对四元函数(x,y,u,vx,\, y,\, u,\, v)关于 xx 求偏导,而  ⁣z ⁣x\dfrac{\pd z}{\pd x} 含义是对二元函数(x,yx,\, y)关于 xx 求偏导。

抽象,难记。找了个网上的方法

对于最难记的 Chain-Rule-3,画出下面的图

同色箭头相乘,异色箭头相加。下一层超过 22 个变量使用偏导,否则使用导数。对某个独立变量的偏导只需追溯所有最终指向它的箭头。从而有

 ⁣z ⁣x= ⁣f ⁣x ⁣x ⁣x+ ⁣f ⁣u ⁣u ⁣x+ ⁣f ⁣v ⁣v ⁣x= ⁣f ⁣x1+ ⁣f ⁣u ⁣u ⁣x+ ⁣f ⁣v ⁣v ⁣x= ⁣f ⁣x+ ⁣f ⁣u ⁣u ⁣x+ ⁣f ⁣v ⁣v ⁣x\begin{aligned} \dfrac{\pd z}{\pd x} &= \dfrac{\pd f}{\pd x} \dfrac{\pd x}{\pd x} + \dfrac{\pd f}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd f}{\pd v} \dfrac{\pd v}{\pd x}\\ &= \dfrac{\pd f}{\pd x} \cdot 1 + \dfrac{\pd f}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd f}{\pd v} \dfrac{\pd v}{\pd x}\\ &= \dfrac{\pd f}{\pd x} + \dfrac{\pd f}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd f}{\pd v} \dfrac{\pd v}{\pd x} \end{aligned}

隐函数

隐函数存在定理 1

P0(x0,y0)R2,G=Nδ(P0)P_0(x_0, y_0) \in \R^2,\, G = N_{\delta}(P_0),若

  1. 函数 FFGG 上连续可微
  2. F(P0)=0F(P_0) = 0
  3. Fy(P0)0F'_y(P_0) \neq 0

则存在 x0x_{0} 的邻域 I=Nδ1(x0)I=N_{\delta_{1}}\left(x_{0}\right) 和唯一的函数 y=f(x)y=f(x) 使得

  1. 对任意 xIx \in I,有 F(x,f(x))=0F(x, f(x)) = 0
  2. f(x0)=y0f(x_0) = y_0
  3. ffII 上连续可微,且有

f(x)=Fx(x,y)Fy(x,y)f'(x) = -\dfrac{F'_x(x, y)}{F'_y(x, y)}

利用上面讲的方法,对隐函数方程两侧求导有

 ⁣F ⁣x ⁣dx ⁣dx+ ⁣F ⁣y ⁣dy ⁣dx=0\dfrac{\pd F}{\pd x} \dfrac{\d x}{\d x} + \dfrac{\pd F}{\pd y} \dfrac{\d y}{\d x} = 0

从而得到

 ⁣dy ⁣dx= ⁣F ⁣x ⁣F ⁣y=Fx(x,y)Fy(x,y)\begin{aligned} \dfrac{\d y}{\d x} &= -\dfrac{\frac{\pd F}{\pd x}}{\frac{\pd F}{\pd y}}\\ &= -\dfrac{F'_x(x, y)}{F'_y(x, y)} \end{aligned}

同理对三元函数有

隐函数存在定理 2

P0(x0,y0,z0)R3,G=Nδ(P0)P_0(x_0, y_0, z_0) \in \R^3,\, G = N_{\delta}(P_0),若

  1. 函数 FFGG 上连续可微
  2. F(P0)=0F(P_0) = 0
  3. Fz(P0)0F'_z(P_0) \neq 0

则存在 U={(x,y)xx0<h,yy0<k}U = \left\lbrace (x, y) \mid \left\lvert x - x_0 \right\rvert < h, \left\lvert y - y_0 \right\rvert < k \right\rbrace 和唯一的函数 z=f(x,y)z=f(x, y) 使得

  1. 对任意 (x,y)U(x, y) \in U,有 F(x,y,f(x,y))=0F(x, y, f(x, y)) = 0
  2. f(x0,y0)=z0f(x_0, y_0) = z_0
  3. ffUU 上连续可微,且有

 ⁣f ⁣x=Fx(x,y,z)Fz(x,y,z), ⁣f ⁣y=Fy(x,y,z)Fz(x,y,z)\begin{aligned} \dfrac{\pd f}{\pd x} = -\dfrac{F'_x(x, y, z)}{F'_z(x, y, z)},\quad \dfrac{\pd f}{\pd y} = -\dfrac{F'_y(x, y, z)}{F'_z(x, y, z)} \end{aligned}

需要注意的一点,偏导不能像导数一样看成是微分的商(微商),偏导数记号  ⁣z ⁣x\dfrac{\pd z}{\pd x}一个整体。下面用一个例子进行具体解释。

对于隐函数 F(x,y,z)=0F(x, y, z) = 0,且其满足隐函数存在定理条件,同时有 Fx,Fy,FzF'_x,\, F'_y,\, F'_z 都不为零,那么根据隐函数存在定理 2,有

 ⁣z ⁣x ⁣x ⁣y ⁣y ⁣z=(FxFz)(FyFx)(FzFy)=1\dfrac{\pd z}{\pd x} \dfrac{\pd x}{\pd y} \dfrac{\pd y}{\pd z} = \left( - \dfrac{F'_x}{F'_z} \right) \left( - \dfrac{F'_y}{F'_x} \right) \left( - \dfrac{F'_z}{F'_y} \right) = -1

而非

 ⁣z ⁣x ⁣x ⁣y ⁣y ⁣z= ⁣z ⁣x ⁣x ⁣y ⁣y ⁣z写着玩,= ⁣z ⁣y ⁣y ⁣z只是玩玩= ⁣z ⁣zconceal=1\begin{aligned} \dfrac{\pd z}{\pd x} \dfrac{\pd x}{\pd y} \dfrac{\pd y}{\pd z} &= \dfrac{\pd z}{\bcancel{\pd x}} \dfrac{\bcancel{\pd x}}{\pd y} \dfrac{\pd y}{\pd z}\\ \phantom{\text{写着玩,}} &= \dfrac{\pd z}{\bcancel{\pd y}} \dfrac{\bcancel{\pd y}}{\pd z}\\ \phantom{\text{只是玩玩}} &= \dfrac{\bcancel{\pd z}}{\bcancel{\pd z}}\\ \phantom{\text{conceal}} &= 1 \end{aligned}

我的理解是,偏导是成对存在的,不存在像微分这样单独的记号,也就是说没有  ⁣x\pd x 这样的记号,因为并不知道这个玩意的含义是什么。但是却有  ⁣dx\d x 这样的记号,因为微分是有明确的含义的。

对于方程组,有

隐函数存在定理 3

P0(x0,y0,u0,v0)R4,G=Nδ(P0)P_0(x_0, y_0, u_0, v_0) \in \R^4,\, G = N_{\delta}(P_0),若

  1. 函数 F,HF,\, HGG 上连续可微
  2. F(P0)=H(P0)=0F(P_0) = H(P_0) = 0
  3. 雅可比行列式(Jacobi Determinant)

J=D(F,H)D(u,v)=FuFvHuHvP00J = \dfrac{D(F, H)}{D(u, v)} = \begin{vmatrix} F'_u & F'_v\\ H'_u & H'_v \end{vmatrix}_{P_0} \ne 0

则存在 U={(x,y)xx0<h,yy0<k}U=\left\{(x, y)\mid |x-x_{0}|<h, | y-y_{0} | <k\right\} 和唯一一组函数 u=u(x,y),v=v(x,y)u=u(x, y), v=v(x, y),使得

  1. 对任意 (x,y)U(x, y) \in U,有 F(x,y,u(x,y),v(x,y))=0,H(x,y,u(x,y),v(x,y))=0F(x, y, u(x, y), v(x, y))=0, H(x, y, u(x, y), v(x, y))=0
  2. u(x0,y0)=u0,v(x0,y0)=v0u(x_0, y_0) = u_0, v(x_0, y_0) = v_0
  3. u,vu, vUU 上连续可微,且有

 ⁣u ⁣x=D(F,H)D(x,v)J, ⁣u ⁣y=D(F,H)D(y,v)J ⁣v ⁣x=D(F,H)D(u,x)J, ⁣v ⁣y=D(F,H)D(u,y)J\begin{aligned} \dfrac{\pd u}{\pd x} &= -\dfrac{\frac{D(F, H)}{D(x, v)}}{J},\quad \dfrac{\pd u}{\pd y} &= -\dfrac{\frac{D(F, H)}{D(y, v)}}{J}\\ \dfrac{\pd v}{\pd x} &= -\dfrac{\frac{D(F, H)}{D(u, x)}}{J},\quad \dfrac{\pd v}{\pd y} &= -\dfrac{\frac{D(F, H)}{D(u, y)}}{J} \end{aligned}

查阅了相关资料,为了更好地理解上面的定理,引入雅可比矩阵。

f ⁣:RnRm\bm{f}\colon\R^n \to \R^m,定义 f\bm{f}雅可比矩阵 J\bm{J} 为代表 f\bm{f} 的从 Rn\R^nRm\R^m 的线性变换的矩阵。

J\bm{J}m×nm \times n 阶矩阵,且有 Jij= ⁣fi ⁣xj\bm{J}_{ij} = \dfrac{\pd f_i}{\pd x_j},即

J=[ ⁣f ⁣x1 ⁣f ⁣xn]=[ ⁣f1 ⁣x1 ⁣f1 ⁣xn ⁣fm ⁣x1 ⁣fm ⁣xn]\bm{J} = \begin{bmatrix} \dfrac{\pd \bm{f}}{\pd x_1} & \cdots & \dfrac{\pd \bm{f}}{\pd x_n} \end{bmatrix} = \begin{bmatrix} \dfrac{\pd f_1}{\pd x_1} & \cdots & \dfrac{\pd f_1}{\pd x_n}\\ \vdots & \ddots & \vdots\\ \dfrac{\pd f_m}{\pd x_1} & \cdots & \dfrac{\pd f_m}{\pd x_n} \end{bmatrix}

还是不太好看懂,重新理解一下多元函数。

先从简单的出发,设二元函数 f ⁣:R2R2\bm{f} \colon \R^2 \to \R^2,可以看作是 (u,v)(F,G)(u, v) \to (F, G),其中 F,G ⁣:R2RF, G\colon \R^2 \to \R

P(u,v),Q(F,G)P(u, v),\, Q(F, G),从而有

 ⁣dF= ⁣F ⁣u ⁣du+ ⁣F ⁣v ⁣dv, ⁣dG= ⁣G ⁣u ⁣du+ ⁣G ⁣v ⁣dv\d F = \dfrac{\pd F}{\pd u} \d u + \dfrac{\pd F}{\pd v} \d v,\quad \d G = \dfrac{\pd G}{\pd u} \d u + \dfrac{\pd G}{\pd v} \d v

写成向量形式,即

[ ⁣dF ⁣dG]= ⁣du[ ⁣F ⁣u ⁣G ⁣u]+ ⁣dv[ ⁣F ⁣v ⁣G ⁣v]=[ ⁣F ⁣u ⁣F ⁣v ⁣G ⁣u ⁣G ⁣v][ ⁣du ⁣dv]\begin{aligned} \begin{bmatrix} \d F\\ \d G \end{bmatrix} &= \d u \begin{bmatrix} \dfrac{\pd F}{\pd u}\\ \dfrac{\pd G}{\pd u} \end{bmatrix} + \d v \begin{bmatrix} \dfrac{\pd F}{\pd v}\\ \dfrac{\pd G}{\pd v} \end{bmatrix}\\ &= \begin{bmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd v}\\ \dfrac{\pd G}{\pd u} & \dfrac{\pd G}{\pd v} \end{bmatrix} \begin{bmatrix} \d u\\ \d v \end{bmatrix} \end{aligned}

可以发现这个矩阵就是雅可比矩阵,即

 ⁣dQ=J ⁣dP\d \vec{Q} = \bm{J} \d \vec{P}

然后就是多元函数,设 f ⁣:RnRm\bm{f}\colon \R^n \to \R^m,可以看作是 xy\vec{x} \to \vec{y},其中 x=(x1,,xn),y=(y1,,ym)\vec{x} = (x_1, \cdots, x_n),\, \vec{y} = (y_1, \cdots, y_m),且 yi=fi(x1,,xn)y_i = f_i(x_1, \cdots, x_n),即 yi ⁣:RnRy_i\colon \R^n \to \R

同样的,令 x=(x1,,xn),y=(y1,,ym)\vec{x} = (x_1, \cdots, x_n),\, \vec{y} = (y_1, \cdots, y_m),从而有

 ⁣dy1=i=1n ⁣y1 ⁣xi ⁣dxi ⁣dym=i=1n ⁣ym ⁣xi ⁣dxi\begin{aligned} \d y_1 &= \sum_{i=1}^{n} \dfrac{\pd y_1}{\pd x_i} \d x_i\\ &\vdots\\ \d y_m &= \sum_{i=1}^{n} \dfrac{\pd y_m}{\pd x_i} \d x_i \end{aligned}

写成向量形式,即

 ⁣dy=[ ⁣dy1 ⁣dym]=i=1n ⁣dxi ⁣y ⁣xi=i=1n ⁣dxi[ ⁣y1 ⁣xi ⁣ym ⁣xi]=[ ⁣y1 ⁣x1 ⁣y1 ⁣xn ⁣ym ⁣x1 ⁣ym ⁣xn][ ⁣dx1 ⁣dxn]=J ⁣dx\begin{aligned} \d \vec{y} = \begin{bmatrix} \d y_1 \\ \vdots \\ \d y_m \end{bmatrix} &= \sum_{i=1}^{n} \d x_i \dfrac{\pd \vec{y}}{\pd x_i}\\ &= \sum_{i=1}^{n} \d x_i \begin{bmatrix} \dfrac{\pd y_1}{\pd x_i} \\ \vdots \\ \dfrac{\pd y_m}{\pd x_i} \end{bmatrix}\\ &= \begin{bmatrix} \dfrac{\pd y_1}{\pd x_1} & \cdots & \dfrac{\pd y_1}{\pd x_n}\\ \vdots & \ddots & \vdots\\ \dfrac{\pd y_m}{\pd x_1} & \cdots & \dfrac{\pd y_m}{\pd x_n} \end{bmatrix} \begin{bmatrix} \d x_1\\ \vdots\\ \d x_n \end{bmatrix}\\ &= \bm{J} \d \vec{x} \end{aligned}

再去看看多元函数的复合函数。设 f ⁣:RnRm,g ⁣:RmRl\bm{f}\colon \R^n \to \R^m,\, \bm{g}\colon \R^m \to \R^l,则有 gf ⁣:RnRl\bm{g} \circ \bm{f}\colon \R^n \to \R^l,即 xz\vec{x} \to \vec{z},其中 z=g(f(x))\vec{z} = \bm{g}(\bm{f}(\vec{x}))

 ⁣dz=Jg ⁣dy=JgJf ⁣dx\begin{aligned} \d \vec{z} &= \bm{J}_{\bm{g}} \d \vec{y}\\ &= \bm{J}_{\bm{g}} \bm{J}_{\bm{f}} \d \vec{x}\\ \end{aligned}

写到这,我陷入了沉思,这与隐函数存在定理 3 有关联吗,我好像只是理解了一下雅可比矩阵的意义。没草稿纸(懒得拿),试着像定理 1 一样尝试理解内涵。

还好只有两个方程,即

{F(x,y,u,v)=0H(x,y,u,v)=0\begin{cases} F(x, y, u, v) = 0\\ H(x, y, u, v) = 0 \end{cases}

先对 xx 求偏导得

{ ⁣F ⁣x+ ⁣F ⁣u ⁣u ⁣x+ ⁣F ⁣v ⁣v ⁣x=0 ⁣H ⁣x+ ⁣H ⁣u ⁣u ⁣x+ ⁣H ⁣v ⁣v ⁣x=0\begin{cases} \dfrac{\pd F}{\pd x} + \dfrac{\pd F}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd F}{\pd v} \dfrac{\pd v}{\pd x} &= 0\\ \dfrac{\pd H}{\pd x} + \dfrac{\pd H}{\pd u} \dfrac{\pd u}{\pd x} + \dfrac{\pd H}{\pd v} \dfrac{\pd v}{\pd x} &= 0 \end{cases}

不是很清晰,我稍微调换一下位置,然后高亮一些部分

{ ⁣F ⁣u ⁣u ⁣x+ ⁣F ⁣v ⁣v ⁣x= ⁣F ⁣x ⁣H ⁣u ⁣u ⁣x+ ⁣H ⁣v ⁣v ⁣x= ⁣H ⁣x\begin{cases} \dfrac{\pd F}{\pd u} \textcolor{FF0099}{\dfrac{\pd u}{\pd x}} + \dfrac{\pd F}{\pd v} \textcolor{0099FF}{\dfrac{\pd v}{\pd x}} &= -\dfrac{\pd F}{\pd x}\\ \dfrac{\pd H}{\pd u} \textcolor{FF0099}{\dfrac{\pd u}{\pd x}} + \dfrac{\pd H}{\pd v} \textcolor{0099FF}{\dfrac{\pd v}{\pd x}} &= -\dfrac{\pd H}{\pd x} \end{cases}

这下就是线代学过最简单的二元一次方程组了,使用克莱姆法则,同时注意到分母的行列式是

 ⁣F ⁣u ⁣F ⁣v ⁣H ⁣u ⁣H ⁣v\begin{vmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd v} \\ \dfrac{\pd H}{\pd u} & \dfrac{\pd H}{\pd v} \end{vmatrix}

这不是巧了吗,正好是雅可比行列式。然后这学期没线代,只记得个分母了,差点忘了克莱姆法则怎么弄,想着形式感觉不大对,还拿出草稿纸准备算算。

对于某一列变量,使用等号右侧的值替代掉行列式的那一列系数,那么就有两个行列式

 ⁣F ⁣x ⁣F ⁣v ⁣H ⁣x ⁣H ⁣v, ⁣F ⁣u ⁣F ⁣x ⁣H ⁣u ⁣H ⁣x-\begin{vmatrix} \dfrac{\pd F}{\pd x} & \dfrac{\pd F}{\pd v} \\ \dfrac{\pd H}{\pd x} & \dfrac{\pd H}{\pd v} \end{vmatrix},\quad -\begin{vmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd x} \\ \dfrac{\pd H}{\pd u} & \dfrac{\pd H}{\pd x} \end{vmatrix}

这也正好就分别是 D(F,H)D(x,v)-\dfrac{D(F, H)}{D(x, v)}D(F,H)D(u,x)-\dfrac{D(F, H)}{D(u, x)}(这个记号的含义是什么我也不清楚,教材用了这个,网上一些资料还用  ⁣(F,H) ⁣(x,v)-\dfrac{\pd(F, H)}{\pd(x, v)}),然后就是隐函数存在定理 3 的结论了。

理解了过程,也就方便进行记忆了(并不,还是蛮难记的)。

下面再补充一点,只不过要是觉得写的不好就删掉了。

写到方程组就直接用克莱姆法则解出来了,没啥意思,用矩阵表示看看会不会有什么新发现(没有就删了)。

[ ⁣F ⁣u ⁣F ⁣v ⁣H ⁣u ⁣H ⁣v][ ⁣u ⁣x ⁣v ⁣x]=[ ⁣F ⁣x ⁣H ⁣x]\begin{bmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd v} \\ \dfrac{\pd H}{\pd u} & \dfrac{\pd H}{\pd v} \end{bmatrix} \begin{bmatrix} \dfrac{\pd u}{\pd x}\\ \dfrac{\pd v}{\pd x} \end{bmatrix} = -\begin{bmatrix} \dfrac{\pd F}{\pd x}\\ \dfrac{\pd H}{\pd x} \end{bmatrix}

yy 的偏导,由于类似,我上面进行了省略,而用矩阵表示的话,就可以添加回来,变成

[ ⁣F ⁣u ⁣F ⁣v ⁣H ⁣u ⁣H ⁣v][ ⁣u ⁣x ⁣u ⁣y ⁣v ⁣x ⁣v ⁣y]=[ ⁣F ⁣x ⁣F ⁣y ⁣H ⁣x ⁣H ⁣y]\begin{bmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd v} \\ \dfrac{\pd H}{\pd u} & \dfrac{\pd H}{\pd v} \end{bmatrix} \begin{bmatrix} \dfrac{\pd u}{\pd x} & \dfrac{\pd u}{\pd y}\\ \dfrac{\pd v}{\pd x} & \dfrac{\pd v}{\pd y} \end{bmatrix} = -\begin{bmatrix} \dfrac{\pd F}{\pd x} & \dfrac{\pd F}{\pd y}\\ \dfrac{\pd H}{\pd x} & \dfrac{\pd H}{\pd y} \end{bmatrix}

从而有

[ ⁣u ⁣x ⁣u ⁣y ⁣v ⁣x ⁣v ⁣y]=[ ⁣F ⁣u ⁣F ⁣v ⁣H ⁣u ⁣H ⁣v]1[ ⁣F ⁣x ⁣F ⁣y ⁣H ⁣x ⁣H ⁣y]\begin{bmatrix} \dfrac{\pd u}{\pd x} & \dfrac{\pd u}{\pd y}\\ \dfrac{\pd v}{\pd x} & \dfrac{\pd v}{\pd y} \end{bmatrix} = -\begin{bmatrix} \dfrac{\pd F}{\pd u} & \dfrac{\pd F}{\pd v} \\ \dfrac{\pd H}{\pd u} & \dfrac{\pd H}{\pd v} \end{bmatrix}^{-1} \begin{bmatrix} \dfrac{\pd F}{\pd x} & \dfrac{\pd F}{\pd y}\\ \dfrac{\pd H}{\pd x} & \dfrac{\pd H}{\pd y} \end{bmatrix}

出现了,雅可比矩阵的逆!这让我想到了什么呢?嗯……什么也没有。那就到此结束吧。

另外对于函数 F ⁣:RnRn\bm{F}\colon \R^n \to \R^n 及其雅可比矩阵 J\bm{J},有其反函数 F1\bm{F}^{-1} 与雅可比矩阵 J\bm{J}',从而因 FF1=ι\bm{F} \circ \bm{F}^{-1} = \iota,从而有 JJ=I\bm{J} \bm{J}' = \bm{I},即 J=J1\bm{J}' = \bm{J}^{-1}。更进一步地,有 J=1JJ' = \dfrac{1}{J}

这为计算雅可比行列式提供了便利,例如后面重积分换元积分需要计算诸如 J(u,v)=D(x,y)D(u,v)J(u, v) = \dfrac{D(x, y)}{D(u, v)} 的雅可比行列式,只需计算 D(u,v)D(x,y)\dfrac{D(u, v)}{D(x, y)} 即可。

多元函数泰勒公式

二元函数的泰勒公式

(x0,y0)R2(x_0, y_0) \in \mathbb{R}^{2},函数 ff 在点 (x0,y0)(x_0, y_0) 的某邻域 GGn+1n+1 阶连续可微,则对任意 (x,y)G(x, y) \in G,有

f(x,y)=k=0n1k!(Δxx+Δyy)kf(x0,y0)+Rn(1)f(x, y)=\sum_{k=0}^{n} \frac{1}{k !}\left(\Delta x \frac{\partial}{\partial x}+\Delta y \frac{\partial}{\partial y}\right)^{k} f(x_0, y_0)+R_{n} \tag{1}

这里

Rn=1(n+1)!(Δxx+Δyy)n+1f(x0+θΔx,y0+θΔy),Δx=xx0,Δy=yy0(0<θ<1).\begin{aligned} R_{n}=\frac{1}{(n+1) !}\left(\Delta x \frac{\partial}{\partial x}+\Delta y \frac{\partial}{\partial y}\right)^{n+1} f(x_0+\theta \Delta x, y_0+\theta \Delta y), \\ \Delta x=x-x_0, \Delta y=y-y_0 \quad(0<\theta<1) . \end{aligned}

(1)(1) 称为 f(x,y)f(x, y) 在点 (x0,y0)(x_0, y_0) 处的 nn 阶泰勒公式,RnR_{n} 称为泰勒公式的拉格朗日余项余项。

(Δx ⁣ ⁣x+Δ ⁣ ⁣y)k=s=0k(ks)ΔxksΔys ⁣k ⁣xks ⁣ys\begin{aligned} \left( \Delta x \dfrac{\pd }{\pd x} + \Delta \dfrac{\pd }{\pd y} \right)^k &= \sum_{s=0}^k \binom{k}{s} \Delta x^{k-s} \Delta y^s \dfrac{\pd^k}{\pd x^{k-s} \pd y^s} \\ \end{aligned}


证明:

取辅助函数

F(t)=f(x0+tΔx,y0+tΔy)(0t1)F(t)=f(x_0+t \Delta x, y_0+t \Delta y) \quad(0 \le t \le 1)

既然 ff 在点 (x0,y0)(x_0, y_0) 的某邻域 GGn+1n+1 阶连续可微,那么 FF[0,1][0, 1]n+1n+1 阶连续可微。根据一元函数的泰勒公式,有

F(0)=f(x0,y0)F(0)= ⁣df ⁣dtt=0= ⁣f ⁣x ⁣dx ⁣dt+ ⁣f ⁣y ⁣dy ⁣dtt=0=Δx ⁣f ⁣x+Δy ⁣f ⁣y(x0,y0)=(Δx ⁣ ⁣x+Δy ⁣ ⁣y)f(x0,y0)F(n)(0)= ⁣dnf ⁣dtnt=0=s=0n1 ⁣dtn( ⁣dx ⁣ ⁣x+ ⁣dy ⁣ ⁣y)nf(x0,y0)=s=0n( ⁣dx ⁣dt ⁣ ⁣x+ ⁣dy ⁣dt ⁣ ⁣y)nf(x0,y0)=s=0n(Δx ⁣ ⁣x+Δy ⁣ ⁣y)nf(x0,y0)\begin{aligned} F(0) &= f(x_0, y_0)\\ F'(0) &= \dfrac{\d f}{\d t}\as_{t=0} = \dfrac{\pd f}{\pd x} \dfrac{\d x}{\d t} + \dfrac{\pd f}{\pd y} \dfrac{\d y}{\d t}\as_{t=0}\\ &= \Delta x \dfrac{\pd f}{\pd x} + \Delta y \dfrac{\pd f}{\pd y}\as_{(x_0, y_0)}\\ &= \left( \Delta x \dfrac{\pd }{\pd x} + \Delta y\dfrac{\pd }{\pd y} \right) f(x_0, y_0)\\ &\vdots\\ F^{(n)}(0) &= \dfrac{\d^n f}{\d t^n}\as_{t=0} = \sum_{s = 0}^{n} \dfrac{1}{\d t^n} \left( \d x \dfrac{\pd }{\pd x} + \d y \dfrac{\pd }{\pd y} \right)^n f(x_0, y_0)\\ &= \sum_{s = 0}^{n} \left( \dfrac{\d x}{\d t} \dfrac{\pd }{\pd x} + \dfrac{\d y}{\d t}\dfrac{\pd }{\pd y} \right)^n f(x_0, y_0)\\ &= \sum_{s = 0}^{n} \left( \Delta x \dfrac{\pd }{\pd x} + \Delta y\dfrac{\pd }{\pd y} \right)^n f(x_0, y_0)\\ \end{aligned}

然后就是一元函数的泰勒公式了

F(t)=k=0n1k!F(k)(0)tk+Rn(t)=k=0n1k!(Δx ⁣ ⁣x+Δy ⁣ ⁣y)kf(x0,y0)tk+Rn(t)\begin{aligned} F(t) &= \sum_{k=0}^n \dfrac{1}{k!}F^{(k)}(0) t^k + R_n(t)\\ &= \sum_{k=0}^n \dfrac{1}{k!} \left( \Delta x \dfrac{\pd }{\pd x} + \Delta y \dfrac{\pd }{\pd y} \right)^k f(x_0, y_0) t^k + R_n(t) \end{aligned}

代入 t=1t=1 即得证。

对比一元函数泰勒公式,辅助记忆

f(x)=k=0nf(k)(x0)k!Δxk+Rn(x)\begin{aligned} f(x) &= \sum_{k=0}^n \dfrac{f^{(k)}(x_0)}{k!} \Delta x^k + R_n(x) \end{aligned}

其中 Rn(x)=f(n+1)(ξ)(n+1)!Δxn+1R_n(x) = \dfrac{f^{(n + 1)}(\xi)}{(n + 1)!}\Delta x^{n+1}ξ\xi 介于 xxx0x_0 之间。

二元函数拉格朗日中值公式

n=0n = 0,有

f(x,y)=f(a,b)+fx(ξ,η)(xa)+fy(ξ,η)(yb)f(x, y)=f(a, b)+f_{x}^{\prime}(\xi, \eta)(x-a)+f_{y}^{\prime}(\xi, \eta)(y-b)

其中 ξ=a+θ(xa),η=b+θ(yb)(0<θ<1)\xi=a+\theta(x-a), \eta=b+\theta(y-b) \quad(0<\theta<1)

多元向量函数

DRnD \subseteq \R^n,函数 f,g,hf, g, h 是定义在 DD 上的 nn 元函数,称

A(x1,x2,,xn)=(f(x1,x2,,xn),g(x1,x2,,xn),h(x1,x2,,xn))\begin{aligned} \bm{A}(x_1, x_2, \cdots, x_n) = \Big( &f(x_1, x_2, \cdots, x_n), \\ &g(x_1, x_2, \cdots, x_n), \\ &h(x_1, x_2, \cdots, x_n) \Big) \end{aligned}

为三维空间 R3\R^3nn 元向量函数。

记得在上篇提过……

设二元向量函数

r(u,v)=(x(u,v),y(u,v),z(u,v))\bm{r}(u, v) = \Big( x(u, v), y(u, v), z(u, v) \Big)

其中 (u,v)G,GR2(u, v) \in G,\, G \subseteq \R^2,设 (u0,v0)(u_0, v_0)GG 的聚点,若存在 aR3\bm{a} \in \R^3 使得

lim(u,v)(u0,v0)r(u,v)a=0\lim_{(u, v) \to (u_0, v_0)} \left\lvert \bm{r}(u, v) - \bm{a} \right\rvert = 0

则称向量函数 r(u,v)\bm{r}(u, v)(u,v)(u0,v0)(u, v) \to (u_0, v_0) 时以 a\bm{a} 为极限,记作

lim(u,v)(u0,v0)r(u,v)=a\lim_{(u, v) \to (u_0, v_0)} \bm{r}(u, v) = \bm{a}

向量函数 r(u,v)=(x(u,v),y(u,v),z(u,v))\bm{r}(u, v)=\Big(x(u, v), y(u, v), z(u, v)\Big)(u,v)(u0,v0)(u, v) \to\left(u_{0}, v_{0}\right) 时以 a=\bm{a}= (a1,a2,a3)\left(a_{1}, a_{2}, a_{3}\right) 为极限的充要条件是

lim(u,v)(u0,v0)x(u,v)=a1,lim(u,v)(u0,v0)y(u,v)=a2,lim(u,v)(u0,v0)z(u,v)=a3\lim\limits_{(u, v) \to (u_0, v_0)} x(u, v) = a_1, \quad \lim\limits_{(u, v) \to (u_0, v_0)} y(u, v) = a_2, \quad \lim\limits_{(u, v) \to (u_0, v_0)} z(u, v) = a_3

设二元向量函数

r(u,v)=(x(u,v),y(u,v),z(u,v))\bm{r}(u, v) = \Big( x(u, v), y(u, v), z(u, v) \Big)

在点 (u,v)(u, v) 的某邻域内有定义,若极限

limΔu0r(u+Δu,v)r(u,v)Δu\lim_{\Delta u \to 0} \frac{\bm{r}(u + \Delta u, v) - \bm{r}(u, v)}{\Delta u}

存在,则称此极限为 r(u,v)\bm{r}(u, v)uu 的偏导数,记作 ru\dfrac{\partial \bm{r}}{\partial u}ru(u,v)\bm{r}_u'(u, v)

设二元向量函数

r(u,v)=(x(u,v),y(u,v),z(u,v))\bm{r}(u, v) = \Big( x(u, v), y(u, v), z(u, v) \Big)

在点 (u,v)(u, v) 的某邻域内有定义,函数 x(u,v),y(u,v),z(u,v)x(u, v),\, y(u, v),\, z(u, v) 在点 (u,v)(u, v) 处对 uu 的偏导数存在,则向量函数 r(u,v)\bm{r}(u, v)(u,v)(u, v) 处对 uu 的偏导数存在,且

ru=(xu(u,v),yu(u,v),zu(u,v))\bm{r}_u' = \Big( x_u'(u, v), y_u'(u, v), z_u'(u, v) \Big)

方向导数

P0R3P_0 \in \R^3,函数 ffP0P_0 的某邻域内有定义,l\bm{l}R3\R^3 中的一个非零向量,且 PU\forall P \in U,都有 P0P\overrightarrow{P_0P}l\bm{l} 的方向相同,若

limPP0f(P)f(P0)P0P\lim\limits_{P \to P_0} \frac{f(P) - f(P_0)}{\lvert \overrightarrow{P_0P} \rvert}

存在,则称此极限为函数 ff 在点 P0P_0 沿方向 l\bm{l} 的方向导数,记作  ⁣f ⁣l(P0)\dfrac{\pd f}{\pd \bm{l}}(P_0)

方向导数都存在无法推出可偏导(大概是因为同一个方向上正向负向可以存在而不同,而偏导要求在那个方向上正向负向存在且相等);可偏导无法推出方向导数都存在。

函数可偏导只能推出该函数沿坐标轴方向的方向导数存在,而不能推出该函数沿其他方向的方向导数存在。

设函数 f(x,y,z)f(x, y, z)(x,y,z)(x, y, z)可微,向量 l\bm{l} 的方向余弦分别为 cosα,cosβ,cosγ\cos \alpha, \cos \beta, \cos \gamma,则函数 f(x,y,z)f(x, y, z) 在点 (x,y,z)(x, y, z) 沿方向 l\bm{l} 的方向导数为

 ⁣f ⁣l(x,y,z)=fx(x,y,z)cosα+fy(x,y,z)cosβ+fz(x,y,z)cosγ\frac{\pd f}{\pd \bm{l}}(x, y, z) = f_x'(x, y, z) \cos \alpha + f_y'(x, y, z) \cos \beta + f_z'(x, y, z) \cos \gamma


证明:

链式法则有

 ⁣f ⁣l(x)= ⁣d ⁣dtt=0f(x+tl)= ⁣d ⁣dtt=0f(x+tcosα,y+tcosβ,z+tcosγ)=fx(x,y,z)cosα+fy(x,y,z)cosβ+fz(x,y,z)cosγ\begin{aligned} \dfrac{\pd f}{\pd \bm{l}}(\bm{x}) &= \dfrac{\d }{\d t}\as_{t = 0} f(\bm{x} + t\bm{l}) \\ &= \dfrac{\d }{\d t}\as_{t = 0} f(x + t\cos \alpha, y + t\cos \beta, z + t\cos \gamma) \\ &= f_x'(x, y, z) \cos \alpha + f_y'(x, y, z) \cos \beta + f_z'(x, y, z) \cos \gamma \end{aligned}

梯度

上面最后一个定理可以写成

fl\grad f \boldsymbol{\cdot} \bm{l}

其中

f=( ⁣f ⁣x, ⁣f ⁣y, ⁣f ⁣z)\grad f = \left( \dfrac{\pd f}{\pd x}, \dfrac{\pd f}{\pd y}, \dfrac{\pd f}{\pd z} \right)

称为函数 f(x,y,z)f(x, y, z)梯度(Gradient),记作 f\grad fgradf\operatorname{grad} f ⁣f ⁣xi+ ⁣f ⁣yj+ ⁣f ⁣zk\dfrac{\pd f}{\pd x} \bm{i} + \dfrac{\pd f}{\pd y} \bm{j} + \dfrac{\pd f}{\pd z} \bm{k}

沿梯度方向,函数方向导数取得最大值,且最大值为梯度的模。


因为方向导数

 ⁣f ⁣l=fl=fcosθ\begin{aligned} \dfrac{\pd f}{\pd \bm{l}} &= \grad f \boldsymbol{\cdot} \bm{l}\\ &= \lvert \grad f \rvert \cdot \cos \theta \end{aligned}

其中 θ\thetaf\grad fl\bm{l} 的夹角,所以 f\lvert \grad f \rvert 为最大值,在 θ=0\theta = 0 时取得。