实二次型
定义
含有 n 个实变量 x1,x2,⋯,xn 的在某个数域上的二次齐次多项式
f(x1,x2,⋯,xn)=i=1∑nj=1∑naijxixj(aij=aji)
称为二次型,若全部 aij∈R,则称为实二次型,若全部 aij∈C,则称为复二次型。
f(x1,x2,⋯,xn)=i=1∑nj=1∑naijxixj=i=1∑naiixi2+i<j∑(aij+aji)xixj=i=1∑naii平方项xi2+2i<j∑aij交叉项xixj
二次型 f 的矩阵表示形式
f(x1,x2,⋯,xn)=[x1x2⋯xn]a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮annx1x2⋮xn=x⊺Ax
其中 A 为对称矩阵,称为二次型 f 的矩阵。A 的秩称为二次型 f 的秩,即 r(f):=r(A) 。
实二次型的标准形
为化简二次型矩阵(仅保留平方项,消去交叉项),要进行变量代换。
⎩⎨⎧x1x2xn=c11y1+c12y2+⋯+c1nyn=c21y1+c22y2+⋯+c2nyn⋮=cn1y1+cn2y2+⋯+cnnyn
设 P=[cij]n 为 n 阶可逆矩阵,考虑非退化线性变换(又称非奇异线性变换,即 P 可逆,由此可得 y=P−1x)
x=Py
其中 y=[y1y2⋯yn]⊺ 为新变量,从而
f(x)=x⊺Axx=Py(Py)⊺A(Py)=y⊺(P⊺AP)y=y⊺By
设 A,B 为同阶方阵,若存在可逆矩阵 P 使得
B=P⊺AP
则称 A 与 B 合同(或 A 合同于 B),B 称为 A 的合同矩阵,P 为 A 到 B 的合同变换矩阵。显然 B 也合同于 A,因为有
A=(P−1)⊺BP−1
至此已学习的矩阵关系
- 等价矩阵:B=PAQ(A,B 为 m×n 矩阵,P,Q 分别为 m 阶和 n 阶可逆矩阵)
- 相似矩阵:B=P−1AP(A,B 为 n 阶方阵,P 为 n 阶可逆矩阵)
- 合同矩阵:B=P⊺AP(A,B 为 n 阶方阵,P 为 n 阶可逆矩阵)
只包含平方项的二次型称为标准形,即
f(x1,x2,⋯,xn)=i=1∑ndiixi2
设实二次型 f(x1,x2,⋯,xn)=x⊺Ax,则存在非退化线性变换 x=Py,使得 f 化为标准形。
等价于证明存在可逆矩阵将实对称矩阵合同变换为实对角矩阵。
因为 A 为实对称矩阵,所以存在正交矩阵 P,使得
P⊺AP=P−1AP=λ1λ2⋱λn
从而令正交变换 x=Py,则有
f(x)=x⊺Ax=(Py)⊺A(Py)=y⊺(P⊺AP)y=y⊺λ1λ2⋱λny=λ1y12+λ2y22+⋯+λnyn2
显然标准型是不唯一的。
化标准形方法
正交变换法(特征值法)
-
求出实二次型的矩阵 A 的特征值 λ1,λ2,⋯,λn 及相应的特征向量 α1,α2,⋯,αn。(若同一特征值特征向量不正交,则使用施密特正交化进行正交。显然经过线性变换后仍然是特征向量。而不同特征值的特征向量,已经在笔记 5 证明是正交的了)
-
取正交矩阵 P=[α1α2⋯αn],则
P⊺AP=λ1λ2⋱λn
-
取正交变换 x=Py
配方法
- 若二次型含有平方项,如 a11x12,则把所有含 x1 的项集中进行配方,即令
⎩⎨⎧y1y2yn=x1+a11a12x2+⋯+a11a1nxn=x2⋮=xn
从而
f=a11y12+f1(y2,y3,⋯,yn)
- 若二次型不含平方项,取非零交叉项,如 2a12x1x2,则令
⎩⎨⎧x1x2x3xn=y1+y2=y1−y2=y3⋮=yn
从而
f=2a12y12−2a12y22+F(y1,y2,y3,y4,⋯,yn)
- 重复上述过程,直至化为标准形。
合同变换法
没时间了,下节课再写。
- 利用二次型矩阵 A,构造 2n×n 矩阵 B=[AE]。
- 对 B 做一次初等列变换,然后再做一次同类型的初等行变换,即 [P1⊺E][AE]P1=[P1⊺AP1P1]。操作若干次化为 [ΛP] 的形式,其中 Λ 为对角矩阵。(原理即为 P⊺AP=Λ,且 P=P1P2⋯Pk)
- 令线性变换 x=Py,则原二次型变为标准型 y⊺Λy。
二次型的规范形
实二次型 f(x1,x2,⋯,xn) 经过非退化的实线性变换得到如下形式的二次型
z12+⋯+zp2−zp+12−⋯−zr2(r⩽n)
称为实二次型 f(x1,x2,⋯,xn) 的实规范形,r 称为实二次型 f(x1,x2,⋯,xn) 的秩,p 称为实二次型 f(x1,x2,⋯,xn) 的正惯性指数,r−p 称为实二次型 f(x1,x2,⋯,xn) 的负惯性指数。
复二次型 f(x1,x2,⋯,xn) 经过非退化的复线性变换得到如下形式的二次型
z12+⋯+zr2(r⩽n)
称为复二次型 f(x1,x2,⋯,xn) 的复规范形,r 称为复二次型 f(x1,x2,⋯,xn) 的秩。
惯性定理
任意实二次型 f(x1,x2,⋯,xn)=x⊺Ax,都可用适当的非退化实线性变换,化成实规范形
z12+⋯+zp2−zp+12−⋯−zr2(r⩽n)
其中 r=r(A),且实规范形唯一。
证明:
存在性:存在可逆矩阵 P 使得 P⊺AP=d1d2⋱dn,其中 di∈R。
设 d1>0,⋯,dp>0;dp+1<0,⋯,dr<0;dr+1=0,⋯,dn=0。
则
fx=Py(d1y12+⋯+dpyp2)+(dp+1yp+12+⋯+dryr2)+(dr+1yr+12+⋯+dnyn2)
取线性变换 y=Qz 使得
⎩⎨⎧z1zpzp+1zrzr+1zn=d1y1⋮=dpyp=−dp+1yp+1⋮=−dryr=yr+1⋮=yn
从而有
fx=Py,y=Qzz12+⋯+zp2−zp+12−⋯−zr2
唯一性:即证 p 唯一确定。
假设存在两个非退化线性变换,使得 x=P1z,x=P2w,即
ffx=P1zz12+⋯+zp2−zp+12−⋯−zr2x=P2ww12+⋯+wq2−wq+12−⋯−wr2
即要证明 p=q。反证法,假设 p>q。
因为 x=P1z=P2w,则 w=P2−1P1z,从而对 w=(P2−1P1)z,有
z12+⋯+zp2−zp+12−⋯−zr2=w12+⋯+wq2−wq+12−⋯−wr2(1)
设 C=P2−1P1,即 w=Cz,则
w1w2⋮wn=c11c21⋮cn1c12c22⋮cn2⋯⋯⋱⋯c1nc2n⋮cnnz1z2⋮zn
令
C=[C1q×pC3(n−q)×pC2q×(n−p)C4(n−q)×(n−p)],z=[z1pz2n−p]
构造齐次方程组
⎩⎨⎧c11z1+c12z2+⋯+c1pzpc21z1+c22z2+⋯+c2pzpcq1z1+cn2z2+⋯+cqpzp=0=0⋮=0
即 C1z1=θ。
由于 q<p,方程个数小于未知元个数,则存在非零解 (z1,z2,⋯,zp)=(t1,t2,⋯,tp)。
取 z=(t1,t2,⋯,tp,0,⋯,0),则
w=Cz=[C1C3C2C4][z1pθn−p]=[C1z1C3z1]=[θqC3z1]=(0,⋯,0q,sq+1,⋯,sn)
代入 (1) 式,得
t12+⋯+tp2=−sq+12−⋯−sn2
左边 t12+⋯+tp2>0,右边 −sq+12−⋯−sn2⩽0,矛盾。
故 p⩽q,同理可证 q⩽p,从而 p=q。
若实对称矩阵 A,B 合同,则二次型 x⊺Ax 与 x⊺Bx 有相同的秩、正惯性指数和负惯性指数。
证明:
存在可逆矩阵 P 使得
P⊺AP=1⋱1−1⋱−10⋱0
而又存在可逆矩阵 Q 使得 B=Q⊺AQ,即 A=(Q−1)⊺BQ−1,从而
P⊺AP=P⊺(Q−1)⊺BQ−1P=(Q−1P)⊺B(Q−1P)=1⋱1−1⋱−10⋱0
令 R=Q−1P,则 R 可逆,且
R⊺BR=1⋱1−1⋱−10⋱0
从而 x⊺Ax 与 x⊺Bx 有相同的秩、正惯性指数和负惯性指数。
正定二次型
设 f(x1,x2,⋯,xn)=x⊺Ax 为实二次型,若对任意实向量 x=θ,都有
f(x)=x⊺Ax>0
则称 f(x) 为正定二次型,A 为正定矩阵。
同理可定义负定二次型和半正定二次型。
正定矩阵一定是实对称矩阵。
如 f(x1,x2,x3)=x12+x22 就不是正定二次型,因为 f(0,0,a)=0 对任意 a∈R\{0} 成立,而 (0,0,a)=θ。
该二次型称为半正定二次型,二次型矩阵称为半正定矩阵,因为对任意实向量 x=θ,都有
f(x)=x⊺Ax⩾0
同理有半负定二次型和半负定矩阵。
设 A 为 n 阶正定矩阵,P 为 n 阶可逆矩阵,则 P⊺AP 也是正定矩阵。
即合同变换不改变正定性。
证明:
因为 A 为正定矩阵,故对任意 x=θ,都有
x⊺Ax>0
即证对任意 y=θ,都有
y⊺(P⊺AP)y>0
令 x=Py,则 x=θ,从而
y⊺(P⊺AP)y=(Py)⊺A(Py)=x⊺Ax>0
顺序主子式
设矩阵 A=[aij]n×n,称如下行列式
a11a21⋮ak1a12a22⋮ak2⋯⋱⋯a1ka2k⋮akk
为 A 的 k 阶顺序主子式。显然 A∈Mn(R) 的顺序主子式有 n 个。
设 A 为 n 阶实对称矩阵,则以下结论等价:
- A 为正定矩阵
- A 的特征值全为正
- A 的正惯性指数为 n
- A 的各阶顺序主子式全为正
- A 合同于单位矩阵 E(存在可逆矩阵 P,使得 A=P⊺P)
证明:(只证明部分)
- ⟹ 4.:
由 A 正定,取 x=(x1,⋯,xk,0,⋯,0),其中 xi 不全为零,则有 x=θ,则 x⊺Ax>0,即
[x1⋯xk]a11⋮ak1⋯⋱⋯a1k⋮akkx1⋮xk[x1⋯xk]Akx1⋮xk>0>0
则 Ak∈Mk(R) 为对称、正定矩阵,从而 ∣Ak∣>0,即 Ak 的顺序主子式全为正。
- ⟹ 1.:
设实对称矩阵 A∈Mn(R)。
数学归纳法,n=1 时显然成立。
假设 n=m−1 时成立,当 n=m 时,有
A=[Bβ⊺βamm]
其中 B∈Mm−1(R) 为对称正定矩阵,β=a1m⋮am−1,m∈Rm−1,amm∈R。
构造 P=[Eθ⊺−B−1β1],则有
P⊺AP=[E(−B−1β)⊺(θ⊺)⊺1][Bβ⊺βamm][Eθ⊺−B−1β1]=[E−β⊺B−1θ1][Bβ⊺βamm][Eθ⊺−B−1β⊺1]=[Bθ⊺βamm−β⊺B−1β][Eθ⊺−B−1β1]=[Bθ⊺θamm−β⊺B−1β]
因为 ∣A∣>0,则
∣P⊺AP∣=∣P⊺∣∣A∣∣P∣=∣P∣2∣A∣>0
即 ∣B∣(amm−β⊺B−1β)>0,而 ∣B∣>0,则有 amm−β⊺B−1β>0。
由 B 为正定矩阵,存在可逆矩阵 Q∈Mm−1(R) 使得 Q⊺BQ=Em−1,令
C=[Qθ⊺θ1]
则有
C⊺(P⊺AP)C=[Q⊺θ⊺θ1][Bθ⊺θamm−β⊺B−1β][Qθ⊺θ1]=[Q⊺BQθ⊺θamm−β⊺B−1β]=[Em−1θ⊺θamm−β⊺B−1β]=(PC)⊺A(PC)
令 D=PC,则有 D⊺AD=[Em−1θ⊺θamm−β⊺B−1β],由 amm−β⊺B−1β>0,故 A 为正定矩阵。
- ⟹ 5.:
fx=Pyλ1y12+⋯+λnyn2,其中 λi>0 为 A 的特征值。
则有正交矩阵 Q 使
A=Qλ1⋱λnQ⊺=Qλ1⋱λnλ1⋱λnQ⊺=Qλ1⋱λnQλ1⋱λn⊺=P⊺P
其中 P=Qλ1⋱λn⊺。
正定矩阵 A 主对角线元素 aii>0。
证明:
存在可逆矩阵 P,使
A=P⊺P=α1⊺⋮αn⊺[α1⋯αn]=α1⊺α1⋮αn⊺α1⋯⋱⋯α1⊺αn⋮αn⊺αn
从而有 aii=αi⊺αi=∥αi∥2>0。(可逆矩阵,不可能为零向量)
主子式
设矩阵 A=[aij]n×n,取 i1<i2<⋯<ik,则如下行列式
ai1i1ai2i1⋮aiki1ai1i2ai2i2⋮aiki2⋯⋯⋱⋯ai1ikai2ik⋮aikik
称为 A 的一个 k 阶主子式。
正定矩阵 A 的 k 阶主子式全为正。
证明:
由 A 正定,取 x=(x1,x2,⋯,xn)⊺,其中 xi1,xi2,⋯,xik 不全为零,其余 n−k 个分量为零,则有 x=θ,则 x⊺Ax>0,即
[xi1⋯xik]ai1i1⋮aiki1⋯⋱⋯ai1ik⋮aikikxi1⋮xik[xi1⋯xik]Bxi1⋮xik>0>0
B∈Mk(R) 为对称、正定矩阵,从而 ∣B∣>0,即 B 的顺序主子式全为正。
由 i1,i2,⋯,ik 的任意性,可知 A 的 k 阶主子式全为正。
上面写正定矩阵合同于单位矩阵,即存在可逆矩阵 P,使得 A=P⊺P。
实际上有更强的结论,存在正定矩阵 B,使得 A=B⊺B,从而 A=B2
证明:
⟸:
A=B2⟹A=B⊺B,其中 B 为正定矩阵。从而 A 正定。
x⊺Ax=x⊺B⊺Bx=(Bx)⊺Bx=∥Bx∥2>0,从而 A 正定。
⟹:
设 A 为正定矩阵,存在正交矩阵 P(PP⊺=E)使得
A=P⊺λ1⋱λnP=P⊺λ1⋱λnλ1⋱λnP=P⊺ΛΛP=P⊺ΛPP⊺ΛP=(P⊺ΛP)⊺(P⊺ΛP)
取 B=P⊺ΛP,则有 A=B⊺B=B2。
设 A 为实对称矩阵,则当实数 t 充分大时,A+tE 为正定矩阵。
证明:
由于 A 为实对称矩阵,存在正交矩阵 P 使得
A=P⊺λ1⋱λnP
则
A+tE=P⊺λ1⋱λnP+tP⊺P=P⊺ΛP+P⊺(tE)P=P⊺(Λ+tE)P=P⊺λ1+t⋱λn+tP
当 t>i=1,⋯,nmax{∣λi∣} 时,A+tE 的特征值全为正,从而 A+tE 为正定矩阵。
若 f 既不是半正定二次型,也不是半负定二次型,则称 f 为不定二次型,称 A 为不定矩阵。
A 为负定矩阵 ⟺ −A 为正定矩阵。
注意负定矩阵行列式不一定为负,实际上有
(−1)ra11a21⋮ar1a12a22⋮ar2⋯⋱⋯a1ra2r⋮arr>0
对实对称矩阵 A,以下结论等价:
- A 为半正定矩阵
- f 正惯性指数 =r(A)
- A 特征值均不小于零
- 存在实矩阵 B,使得 A=B⊺B
- A 所有主子式不小于零(不是顺序主子式!)