多元函数几何应用与极值

几何应用

空间曲线的切线与法平面

类似地,有

设有空间曲线 CCP0P_{0} 是曲线 CC 上一定点,PP 是曲线上的动点,作割线 P0PP_{0} P,当 PP 沿着曲线 CC 无限地接近 P0P_{0} 时,若割线 P0PP_{0} P 的极限位置存在,对应的直线记为 LL,我们称直线 LL 为曲线 CC 在点 P0P_{0}切线

通过点 P0P_{0} 且与切线 LL 垂直的平面, 称为曲线 CC 在点 P0P_{0}法平面。切线 LL 的方向向量称为曲线 CC 在点 P0P_{0}切向量

设空间曲线 CC 的参数方程为

{x=φ(t)y=ψ(t)z=ω(t),t[a,b]\left\lbrace\begin{aligned} x &= \varphi(t)\\ y &= \psi(t)\\ z &= \omega(t) \end{aligned}\right.,\quad t \in [a, b]

这里 φ(t),ψ(t),ω(t)\varphi(t), \psi(t), \omega(t)t=t0t = t_0 处皆可导,且 φ(t0),ψ(t0),ω(t0)\varphi'(t_0), \psi'(t_0), \omega'(t_0) 不全为 00,则曲线 CC 在点 P0P_0 处的切向量

(φ(t0),ψ(t0),ω(t0))\Big( \varphi'(t_0), \psi'(t_0), \omega'(t_0) \Big)

曲线 CC 在点 P0P_0 处的法平面

φ(t0)(xφ(t0))+ψ(t0)(yψ(t0))+ω(t0)(zω(t0))=0\varphi'(t_0)\Big(x - \varphi(t_0)\Big) + \psi'(t_0)\Big(y - \psi(t_0)\Big) + \omega'(t_0)\Big(z - \omega(t_0)\Big) = 0

设空间曲线 CC 一般方程为

{F(x,y,z)=0,H(x,y,z)=0\left\lbrace\begin{aligned} F(x, y, z) &= 0,\\ H(x, y, z) &= 0 \end{aligned}\right.

这里 F,HF,\, H 连续可微,且 D(F,H)D(y,z),D(F,H)D(z,x),D(F,H)D(x,y)\dfrac{D(F, H)}{D(y, z)},\, \dfrac{D(F, H)}{D(z, x)},\, \dfrac{D(F, H)}{D(x, y)} 不全为 00,则化为参数方程有

{x=φ(t)y=ψ(t)z=ω(t)\left\lbrace\begin{aligned} x &= \varphi(t)\\ y &= \psi(t)\\ z &= \omega(t) \end{aligned}\right.

有关于 tt 恒等式

{F(φ(t),ψ(t),ω(t))=0,H(φ(t),ψ(t),ω(t))=0\left\lbrace\begin{aligned} F\Big(\varphi(t), \psi(t), \omega(t)\Big) &= 0,\\ H\Big(\varphi(t), \psi(t), \omega(t)\Big) &= 0 \end{aligned}\right.

tt 求全导数有

{Fxφ(t)+Fyψ(t)+Fzω(t)=0,Hxφ(t)+Hyψ(t)+Hzω(t)=0\left\lbrace\begin{aligned} F_x'\varphi'(t) + F_y'\psi'(t) + F_z'\omega'(t) &= 0,\\ H_x'\varphi'(t) + H_y'\psi'(t) + H_z'\omega'(t) &= 0 \end{aligned}\right.

{n1=(Fx,Fy,Fz),n2=(Hx,Hy,Hz)\left\lbrace\begin{aligned} \bm{n_1} &= (F_x', F_y', F_z'),\\ \bm{n_2} &= (H_x', H_y', H_z') \end{aligned}\right.

切向量n1×n2\bm{n_1} \boldsymbol{\times} \bm{n_2} 平行,其中

n1×n2=(D(F,H)D(y,z),D(F,H)D(z,x),D(F,H)D(x,y))\bm{n_1} \boldsymbol{\times} \bm{n_2} = \left( \dfrac{D(F, H)}{D(y, z)}, \dfrac{D(F, H)}{D(z, x)}, \dfrac{D(F, H)}{D(x, y)} \right)

切向量可取

(D(F,H)D(y,z)P0,D(F,H)D(z,x)P0,D(F,H)D(x,y)P0)\left( \dfrac{D(F, H)}{D(y, z)}\as_{P_0}, \dfrac{D(F, H)}{D(z, x)}\as_{P_0}, \dfrac{D(F, H)}{D(x, y)}\as_{P_0} \right)

曲线 CC 在点 P0P_0 处的法平面

D(F,H)D(y,z)P0(xx0)+D(F,H)D(z,x)P0(yy0)+D(F,H)D(x,y)P0(zz0)=0\dfrac{D(F, H)}{D(y, z)}\as_{P_0}(x - x_0) + \dfrac{D(F, H)}{D(z, x)}\as_{P_0}(y - y_0) + \dfrac{D(F, H)}{D(x, y)}\as_{P_0}(z - z_0) = 0

或表示为

xx0yy0zz0Fx(P0)Fy(P0)Fz(P0)Hx(P0)Hy(P0)Hz(P0)=0\begin{vmatrix} x - x_0 & y - y_0 & z - z_0 \\ F_x'(P_0) & F_y'(P_0) & F_z'(P_0) \\ H_x'(P_0) & H_y'(P_0) & H_z'(P_0) \end{vmatrix} = 0

空间曲面的切平面与法线

设有空间曲面 S,P0S, P_{0} 是曲面 SS 上一定点,CC 是曲面 SS 上通过点 P0P_{0} 的任意一条光滑曲线,如果曲线 CC 在点 P0P_{0} 的切线总保持在某一平面 Π\Pi 上,则称平面 Π\Pi 为曲面 SS 在点 P0P_{0}切平面。通过点 P0P_{0} 且与切平面 Π\Pi 垂直的直线称为曲面 SS 在点 P0P_{0}法线。切平面 Π\Pi 的法向量称为曲面 SS 在点 P0P_{0}法向量

设空间曲面 SS 一般式方程为

F(x,y,z)=0F(x, y, z) = 0

这里 FF 连续可微,且 Fx,Fy,FzF_x',\, F_y',\, F_z' 不全为 00

SS 上任取通过 P0P_0 的一条光滑曲线 CC,设 CC 的参数方程为

{x=φ(t)y=ψ(t)z=ω(t)\left\lbrace\begin{aligned} x &= \varphi(t)\\ y &= \psi(t)\\ z &= \omega(t) \end{aligned}\right.

则有恒等式

F(φ(t),ψ(t),ω(t))0F(\varphi(t), \psi(t), \omega(t)) \equiv 0

tt 求全导数有

Fxφ(t)+Fyψ(t)+Fzω(t)=0F_x'\varphi'(t) + F_y'\psi'(t) + F_z'\omega'(t) = 0

也就是说,切向量 r=(φ(t),ψ(t),ω(t))n\bm{r}' = \Big(\varphi'(t), \psi'(t), \omega'(t)\Big) \perp \bm{n},其中

n=(Fx,Fy,Fz)\bm{n} = (F_x', F_y', F_z')

所以 n\bm{n} 是空间曲面 SSP0P_0 的法向量,切平面的方程为

Fx(P0)(xx0)+Fy(P0)(yy0)+Fz(P0)(zz0)=0F_x'(P_0)(x - x_0) + F_y'(P_0)(y - y_0) + F_z'(P_0)(z - z_0) = 0

法线方程为

xx0Fx(P0)=yy0Fy(P0)=zz0Fz(P0)\dfrac{x - x_0}{F_x'(P_0)} = \dfrac{y - y_0}{F_y'(P_0)} = \dfrac{z - z_0}{F_z'(P_0)}

设空间曲面 SS 的参数方程为

{x=x(u,v)y=y(u,v)z=z(u,v)\left\lbrace\begin{aligned} x &= x(u, v)\\ y &= y(u, v)\\ z &= z(u, v) \end{aligned}\right.

则有恒等式

F(x(u,v),y(u,v),z(u,v))0F\Big(x(u, v), y(u, v), z(u, v)\Big) \equiv 0

分别对 u,vu, v 求偏导得

{Fxxu+Fyyu+Fzzu=0,Fxxv+Fyyv+Fzzv=0\left\lbrace\begin{aligned} F_x'x_u' + F_y'y_u' + F_z'z_u' &= 0,\\ F_x'x_v' + F_y'y_v' + F_z'z_v' &= 0 \end{aligned}\right.

r(u,v)=(x(u,v),y(u,v),z(u,v))\bm{r}(u, v) = \Big(x(u, v), y(u, v), z(u, v)\Big)

SS 的法向量 n=(Fx,Fy,Fz)\bm{n} = (F_x', F_y', F_z')nru,nrv\bm{n} \perp \bm{r}_u',\, \bm{n} \perp \bm{r}_v',从而 n\bm{n}ru×rv\bm{r}_u' \boldsymbol{\times} \bm{r}_v' 平行,其中

ru×rv=(A,B,C)=(D(y,z)D(u,v),D(z,x)D(u,v),D(x,y)D(u,v))\bm{r}_u' \boldsymbol{\times} \bm{r}_v' = (A, B, C) = \left( \dfrac{D(y, z)}{D(u, v)}, \dfrac{D(z, x)}{D(u, v)}, \dfrac{D(x, y)}{D(u, v)} \right)

法向量可取

(A(u0,v0),B(u0,v0),C(u0,v0))\Big(A(u_0, v_0), B(u_0, v_0), C(u_0, v_0)\Big)

切平面方程为

A(u0,v0)(xx0)+B(u0,v0)(yy0)+C(u0,v0)(zz0)=0A(u_0, v_0)(x - x_0) + B(u_0, v_0)(y - y_0) + C(u_0, v_0)(z - z_0) = 0

xx0yy0zz0xu(u0,v0)yu(u0,v0)zu(u0,v0)xv(u0,v0)yv(u0,v0)zv(u0,v0)=0\begin{vmatrix} x - x_0 & y - y_0 & z - z_0\\ x_u'(u_0, v_0) & y_u'(u_0, v_0) & z_u'(u_0, v_0)\\ x_v'(u_0, v_0) & y_v'(u_0, v_0) & z_v'(u_0, v_0) \end{vmatrix} = 0

法线方程为

xx0A(u0,v0)=yy0B(u0,v0)=zz0C(u0,v0)\dfrac{x - x_0}{A(u_0, v_0)} = \dfrac{y - y_0}{B(u_0, v_0)} = \dfrac{z - z_0}{C(u_0, v_0)}

极值

极值定义与一元函数类似,懒得写了。

极值的必要条件

设函数 f(x,y)f(x, y)(x0,y0)(x_0, y_0) 可偏导,且 f(x0,y0)f(x_0, y_0)ff 的极值,则

fx(x0,y0)=fy(x0,y0)=0f_x'(x_0, y_0) = f_y'(x_0, y_0) = 0

同样也可以定义驻点,即使

fx(x0,y0)=fy(x0,y0)=0f_x'(x_0, y_0) = f_y'(x_0, y_0) = 0

的点 (x0,y0)(x_0, y_0)

对于 nn 元函数

f(x1,,xn)f(x_1, \cdots, x_n)

黑塞矩阵 Hij(f)=[ ⁣2f ⁣xixj]\bm{H}_{ij} (f) = \left[ \dfrac{\pd^2 f}{\pd x_i x_j} \right],即

H(f)=[ ⁣2f ⁣x12 ⁣2f ⁣x1xn ⁣2f ⁣xnx1 ⁣2f ⁣xn2]\bm{H} (f) = \begin{bmatrix} \dfrac{\pd^2 f}{\pd x_1^2} & \cdots & \dfrac{\pd^2 f}{\pd x_1 x_n} \\ \vdots & \ddots & \vdots \\ \dfrac{\pd^2 f}{\pd x_n x_1} & \cdots & \dfrac{\pd^2 f}{\pd x_n^2} \end{bmatrix}

显然 H(f)\bm{H} (f) 是一个 n×nn \times n 的对称矩阵(当 ffnn 个偏导连续性时)。

而且有

H(f)=J(f)\bm{H}(f) = \bm{J}(\grad f)^\intercal

即函数的黑塞矩阵是其梯度的雅可比矩阵的转置。

极值判别法

a=(a1,,an)Rn\bm{a} = (a_1, \cdots, a_n) \in \R^n,函数 f(x)=f(x1,,xn)f(\bm{x}) = f(x_1, \cdots, x_n)a\bm{a} 的某邻域二阶连续可微,且 f(a)=0\grad f(\bm{a}) = \bm{0}(即 fxi(a)=0(1in)f'_{x_i}(\bm{a}) = 0\:(1 \le i \le n)),设函数 ff 的黑塞矩阵为 H(f(x))\bm{H} (f(\bm{x})),则

  1. H(f(a))\bm{H} (f(\bm{a}))正定矩阵,则 ffa\bm{a} 处取得严格极小值
  2. H(f(a))\bm{H} (f(\bm{a}))负定矩阵,则 ffa\bm{a} 处取得严格极大值
  3. H(f(a))\bm{H} (f(\bm{a}))不定矩阵,则 ffa\bm{a} 处不取极值。

P0(x0,y0)R2,G=Nδ(P0)P_0(x_0, y_0) \in \R^2,\, G = N_{\delta}(P_0),函数 ffGG 内二阶连续可微,且 fx(x0,y0)=fy(x0,y0)=0f_x'(x_0, y_0) = f_y'(x_0, y_0) = 0,则黑塞矩阵

[ABBC]=[fxx(x0,y0)fxy(x0,y0)fyx(x0,y0)fyy(x0,y0)]\begin{bmatrix} A & B \\ B & C \end{bmatrix} = \begin{bmatrix} f_{x x}''(x_0, y_0) & f_{x y}''(x_0, y_0) \\ f_{y x}''(x_0, y_0) & f_{y y}''(x_0, y_0) \end{bmatrix}

  1. B2AC<0,A>0B^2 - AC < 0,\, A > 0,则 ffP0P_0 处取得严格极小值
  2. B2AC<0,A<0B^2 - AC < 0,\, A < 0,则 ffP0P_0 处取得严格极大值
  3. B2AC>0B^2 - AC > 0,则 ffP0P_0不取极值
  4. B2AC=0B^2 - AC = 0,则 ff 不一定P0P_0 处取得极值。

nn 元函数 f(x)=f(x1,,xn)f(\bm{x}) = f(x_1, \cdots, x_n),其 a\bm{a} 处泰勒公式为

f(x)=f(a)+f(a)h+12hH(f(a+θh))h,h=xa,θ(0,1)f(\bm{x}) = f(\bm{a}) + \grad f(\bm{a}) \boldsymbol{\cdot} \bm{h} + \dfrac{1}{2} \bm{h}^\intercal \bm{H} (f(\bm{a} + \theta \bm{h})) \bm{h},\quad \bm{h} = \bm{x} - \bm{a},\, \theta \in (0, 1)

若在 a\bm{a}f(a)=0\grad f(\bm{a}) = 0,且 H(f(a))\bm{H} (f(\bm{a})) 是正定矩阵,则 f(x)f(\bm{x})a\bm{a} 处取得严格极小值。


由于线代已经忘光了,上面的就懒得写推导过程了。

条件极值

拉格朗日乘子法

函数 f(x1,,xn)f(x_1, \cdots, x_n) 在满足约束条件 φi(x1,,xn)=0(i=1,m;  m<n)\varphi_i(x_1, \cdots, x_n) = 0\quad (i = 1, \cdots m;\; m < n) 下的极值问题,可归结为对拉格朗日函数

L(x1,,xn,λ1,,λm)=f(x1,,xn)+i=1mλiφi(x1,,xn)\mathcal{L}(x_1, \cdots, x_n, \lambda_1, \cdots, \lambda_m) = f(x_1, \cdots, x_n) + \sum_{i=1}^m \lambda_i \varphi_i(x_1, \cdots, x_n)

求普通(无约束)函数极值的问题。其中 λi\lambda_i拉格朗日乘子

通过一个简单的情形,理解一下内涵。令 n=3,m=1n = 3, m = 1,则为函数 f(x,y,z)f(x, y, z) 在约束条件 φ(x,y,z)=0\varphi(x, y, z) = 0 下的极值问题。

f(x,y,z)f(x, y, z) 相当于空间中无数个(f(x,y,z)=kf(x, y, z) = k 才确定了是哪一个)曲面 Σ\Sigma,对任意极值点 PΣP \in \Sigma,有经过 PPΣ\Sigma 的切向量 vR3\vec{v} \in \R^3,则有 f(P)v=0\grad f(P) \boldsymbol{\cdot} \vec{v} = 0(否则沿 v\vec{v} 方向的方向导数不为 00PP 邻域沿 v\vec{v} 方向上 ff 会增大或减小,不再是极值)。同理 φ(P)v=0\grad \varphi(P) \boldsymbol{\cdot} \vec{v} = 0,也就是说 f(P)/ ⁣/φ(P)\grad f(P) \par \grad \varphi(P),即存在 λ\lambda 使得 f(P)+λφ(P)=(f+λφ)(P)=0\grad f(P) + \lambda \grad \varphi(P) = \grad (f + \lambda \varphi)(P) = \vec{0}

此时构造拉格朗日函数 L(x,y,z,λ)=f(x,y,z)+λφ(x,y,z)\mathcal{L}(x, y, z, \lambda) = f(x, y, z) + \lambda \varphi(x, y, z),则 L(P)=0\grad \mathcal{L}(P) = \vec{0},即 PPL\mathcal{L} 的驻点。

然后是课本上的这种情形的严格证明。

设函数 f(x,y,z),φ(x,y,z)f(x, y, z),\, \varphi(x, y, z) 连续可微,且 φz0\varphi_z' \ne 0,设函数 f(x,y,z)f(x, y, z) 在满足约束方程 φ(x,y,z)=0\varphi(x, y, z) = 0 的条件极值在点 P0(x0,y0,z0)P_0(x_0, y_0, z_0) 处取得,令

L(x,y,z,λ)=f(x,y,z)+λφ(x,y,z)\mathcal{L}(x, y, z, \lambda) = f(x, y, z) + \lambda \varphi(x, y, z)

P0P_0 满足方程组

{Lx(P0)=fx(P0)+λφx(P0)=0Ly(P0)=fy(P0)+λφy(P0)=0Lz(P0)=fz(P0)+λφz(P0)=0Lλ(P0)=φ(P0)=0\left\lbrace\begin{aligned} \mathcal{L}_x'(P_0) &= f_x'(P_0) + \lambda \varphi_x'(P_0) &= 0 \\ \mathcal{L}_y'(P_0) &= f_y'(P_0) + \lambda \varphi_y'(P_0) &= 0 \\ \mathcal{L}_z'(P_0) &= f_z'(P_0) + \lambda \varphi_z'(P_0) &= 0 \\ \mathcal{L}_{\lambda}'(P_0) &= \varphi(P_0) &= 0 \end{aligned}\right.


证明:

既然 ffP0P_0 取得条件极值,首先有

φ(P0)=0\varphi(P_0) = 0

因为 φz(P0)0\varphi_z'(P_0) \ne 0,隐函数存在定理知存在 (x0,y0)(x_0, y_0) 的邻域 UU 使得 φ(x,y,z)=0\varphi(x, y, z) = 0 有唯一解 z=z(x,y)z = z(x, y),同时

z0=z(x0,y0),φ(x,y,z(x,y))=0,(x,y)Uzx(x0,y0)=φx(P0)φz(P0),zy(x0,y0)=φy(P0)φz(P0)(1)z_0 = z(x_0, y_0),\quad \varphi(x, y, z(x, y)) = 0,\quad \forall (x, y) \in U\\ z_x'(x_0, y_0) = -\frac{\varphi_x'(P_0)}{\varphi_z'(P_0)},\quad z_y'(x_0, y_0) = -\frac{\varphi_y'(P_0)}{\varphi_z'(P_0)} \tag{1}

由于 f(x,y,z(x,y))f(x, y, z(x, y))(x0,y0)(x_0, y_0) 取得极值,所以

{fx(P0)+fz(P0)zx(x0,y0)=0fy(P0)+fz(P0)zy(x0,y0)=0\left\lbrace\begin{aligned} f_x'(P_0) + f_z'(P_0)z_x'(x_0, y_0) &= 0 \\ f_y'(P_0) + f_z'(P_0)z_y'(x_0, y_0) &= 0 \end{aligned}\right.

代入 (1)(1) 式,得

{fx(P0)1φz(P0)fz(P0)φx(P0)=0fy(P0)1φz(P0)fz(P0)φy(P0)=0\left\lbrace\begin{aligned} f_x'(P_0) - \dfrac{1}{\varphi_z'(P_0)} f_z'(P_0) \varphi_x'(P_0) &= 0 \\ f_y'(P_0) - \dfrac{1}{\varphi_z'(P_0)} f_z'(P_0) \varphi_y'(P_0) &= 0 \end{aligned}\right.

λ=fz(P0)φz(P0)\lambda = -\dfrac{f_z'(P_0)}{\varphi_z'(P_0)},则有

{fx(P0)+λφx(P0)=0fy(P0)+λφy(P0)=0fz(P0)+λφz(P0)=0φ(P0)=0\left\lbrace\begin{aligned} f_x'(P_0) + \lambda \varphi_x'(P_0) &= 0 \\ f_y'(P_0) + \lambda \varphi_y'(P_0) &= 0 \\ f_z'(P_0) + \lambda \varphi_z'(P_0) &= 0\\ \varphi(P_0) &= 0 \end{aligned}\right.