矩阵可对角化
若 n 阶方阵 A 相似于一个对角矩阵,即存在可逆矩阵 P 使
P−1AP=Λ
则称 A 可对角化。
n 阶方阵 A 可对角化的充要条件是 A 有 n 个线性无关的特征向量。
证明:
⟸:
已知 A 有 n 个线性无关的特征向量 η1,η2,⋯,ηn
设
⎩⎨⎧Aη1Aη2⋮Aηn=λ1η1=λ2η2=λnηn
记 P=[η1η2⋯ηn],则 ∣P∣=0,即 P 可逆。
AP=A[η1η2⋯ηn]=[Aη1Aη2⋯Aηn]=[λ1η1λ2η2⋯λnηn]=[η1η2⋯ηn]λ1λ2⋱λn=PΛ
所以
P−1AP=Λ
⟹:
设 Λ=λ1λ2⋱λn
则 ∃P,∣P∣=0,P−1AP=Λ,则
PA=PΛ
记 P=[η1η2⋯ηn],则
A[η1η2⋯ηn][Aη1Aη2⋯Aηn]=[η1η2⋯ηn]λ1λ2⋱λn=[λ1η1λ2η2⋯λnηn]
所以
⎩⎨⎧Aη1Aη2⋮Aηn=λ1η1=λ2η2=λnηn
而 P 可逆,所以 η1,η2,⋯,ηn 线性无关。
若 A 特征值没有重根(即恰有 n 个不同的特征值),则 A 可对角化。
幂零矩阵不可对角化。
证明:
O 显然成立。
假设 A=O 可对角化,则存在可逆矩阵 P 使
P−1AP=λ1λ2⋱λn
又因为
P−1AkP=Λk
由于 A 幂零,故 Ak=O,即
P−1AkP=O
所以
λ1k=λ2k=⋯=λnk=0
即 λ1=λ2=⋯=λn=0,那么
A=PΛP−1=O
与 A=O 矛盾,所以 A 不可对角化。
除此以外,若 J 为幂零矩阵,则 kE+J(若尔当分解型)也不可对角化。
设 λ1,λ1,⋯,λm 为 n 阶方阵 A 所有相异的特征值,对于每个 i=1,⋯,m,记 ηi1,ηi2,⋯,ηisi 为 A 关于 λi 的所有线性无关的特征向量,其中 si 为 λi 的代数重数,则向量组
η11,η12,⋯,η1s1,η21,η22,⋯,η2s2,⋯,ηm1,ηm2,⋯,ηmsm
也线性无关。
证明:
设 ∃k11,k12,⋯,k1s1,k21,k22,⋯,k2s2,⋯,km1,km2,⋯,kmsm 使
(k11η11+k12η12+⋯+k1s1η1s1)β1(k21η21+k22η22+⋯+k2s2η2s2)β2⋯(km1ηm1+km2ηm2+⋯+kmsmηmsm)βm+++=θ
即
β1+β2+⋯+βm=θ(1)
其中
⎩⎨⎧Aβ1Aβ2⋮Aβm=λ1β1=λ2β2=λmβm(2)
不妨设 βj1,βj2,⋯,βjt 为 β1,β2,⋯,βm 中不为 θ 的向量,其中 t⩽m,则由 (1) 有
βj1+βj2+⋯+βjt=θ(3)
由 (2) 有 βj1,βj2,⋯,βjt 为 A 关于 λj1,λj2,⋯,λjt 的特征向量,且 λj1,λj2,⋯,λjt 相异,所以 βj1,βj2,⋯,βjt 线性无关,从而与 (3) 矛盾(线性无关的向量组无法被线性表示为零向量)。
所以 β1,β2,⋯,βm 中不为 θ 的向量个数 t=0,即 β1,β2,⋯,βm 全为 θ。
而 ∀i,βi=θ,且有 ηi1,ηi2,⋯,ηisi 线性无关,所以 ki1=ki2=⋯=kisi=0,得证。
n 阶方阵 A 特征多项式有因式分解
∣λE−A∣=(λ−λ1)n1(λ−λ2)n2⋯(λ−λm)nm
其中 λ1,λ2,⋯,λm 为 A 的所有相异的特征值,n1,n2,⋯,nm 分别为 λ1,λ2,⋯,λm 的代数重数,ni⩾1 且 n1+n2+⋯+nm=n。
方程 (λiE−A)x=θ 的基础解系的个数,即 n−r(λiE−A),称为 λi 的几何重数。
几何重数 ⩽ 代数重数。
设 λ0 是 A 的 k 重特征值,则其几何重数 ⩽k,即 λ0 的线性无关的特征向量个数不超过 k 个。
证明:
设 (λ0E−A)x=θ 的基础解系为 η1,η2,⋯,ηs∈Rn。
则
⎩⎨⎧Aη1Aη2⋮Aηs=λ0η1=λ0η2=λ0ηs
将 η1,η2,⋯,ηs 扩充为 Rn 的一组线性无关的向量组 η1,η2,⋯,ηs,ηs+1,⋯,ηn。
则
Aηs+1⋮Aηn=c1,s+1η1+⋯+cs,s+1ηs+cs+1,s+1ηs+1+⋯+cn,s+1ηn=c1,nη1+⋯+cs,nηs+cs+1,nηs+1+⋯+cn,nηn
即
[Aη1⋯Aηn]=[η1⋯ηsηs+1⋯ηn]λ0⋱λ0c1,s+1⋮cs,s+1cs+1,s+1⋮cn,s+1⋯⋱⋯⋯⋱⋯c1,n⋮cs,ncs+1,n⋮cn,n=[η1⋯ηsηs+1⋯ηn][λ0EsOC1C2]
记 P=[η1⋯ηsηs+1⋯ηn],则
APP−1AP=P[λ0EsOC1C2]=[λ0EsOC1C2]=B
即 A 与 B 相似。
又
∣λE−B∣=(λ−λ0)EsO−C1λEn−s−C2=∣(λ−λ0)Es∣∣λEn−s−C2∣=(λ−λ0)s∣λEn−s−C2∣=(λ−λ0)sfC2(λ)
λ0 至少为 B 的 s 重特征值。
又 ∣λE−A∣=(λ−λ0)kh(λ)(λ0 不是 h(λ)=0 的根,因为 λ0 只是 A 的 k 重特征值),且 ∣λE−A∣=∣λE−B∣,所以 s⩽k。否则若 s>k,则 λ0 至少为 A 的 s 重特征值,与 λ0 为 A 的 k 重特征值矛盾。
锚点有点问题,Admonition 里的锚点是单独放在 Admonition 里面的,然而锚点地址是一样的,导致这里的第一个锚点(以及后面的唯一锚点)都会跳转到上面的锚点。这个问题,以及 Admonition 内代码块渲染的问题都是因为 Admonition 里面的内容是单独渲染的,我也没暂时没有解决方案,只能说 Admonition 里的锚点尽量少用吧。
大分块矩阵源码
1 2 3 4 5 6 7 8 9 10 11
| \begin{bmatrix} \begin{array}{cccc:ccc} \lambda_0 & & & c_{1, s+1} & \cdots & c_{1, n} \\ & \ddots & & \vdots & \ddots & \vdots \\ & & \lambda_0 & c_{s, s+1} & \cdots & c_{s, n} \\ \hdashline & & & c_{s+1, s+1} & \cdots & c_{s+1, n} \\ & & & \vdots & \ddots & \vdots \\ & & & c_{n, s+1} & \cdots & c_{n, n} \end{array} \end{bmatrix}
|
正交矩阵
设 α,β 为 n 维向量,按列向量表示为
α=a1a2⋮an,β=b1b2⋮bn
若 α,β 为实向量,则称
i=1∑naibi
为 α,β 的内积,记为 (α,β)。
即
(α,β)=α⊺β
若 α,β 为复向量,则称
i=1∑naibˉi
为 α,β 的内积,记为 (α,β)。
即
(α,β)=α⊺βˉ
后面讨论的大都是实向量。而实向量内积的性质,都比较容易,不再赘述。
然而遗憾的是,一个比较基本的性质,即可交换性,对于复向量内积来说,却不再成立,也即
(α,β)=(β,α)
这也难怪,看复向量内积的定义,看起来就不太对称的样子。而复向量内积那样定义,是为了保证模定义的有意义性。
并记
∥α∥=(α,α)
为 α 的模。
若 (α,β)=0,则称 α,β 正交(垂直)。
若 α,β 不为零向量,则称
θ=arccos(∥α∥⋅∥β∥(α,β)),0⩽θ⩽π
为 α,β 的夹角。
若一个不含零向量的向量组 {αi} 中的任意两个向量都正交,则称 {αi} 为正交向量组。
若一个不含零向量的向量组 {αi} 中的任意两个向量都正交,且 {αi} 中任意向量的模都为 1,则称 {αi} 为标准正交向量组,简称法正交组,还可表示为
(αi,αj)={1,0,i=ji=j
若 {αi}m 为正交向量组,则 {αi}m 线性无关。
设
k1α1+k2α2+⋯+kmαm=θ(1)
对式 (1) 左乘 αi⊺,得
j=1∑n(αi,kjαj)ki(αi,αi)ki=0=0=0⟹⟹
从而 ∀i=1,2,⋯,m,ki=0,即 {αi}m 线性无关。
对 α∈Rn 与法正交组 {ei}n,有
α=i=1∑n(α,ei)ei
施密特正交化
施密特正交化
设 {αi}n 为线性无关的向量组,目标是构造出等价的正交向量组 {βi}n。
不妨取 β1=α1=θ。
而 α2 在 β1 的投影向量为 ∥β1∥(α2,β1)∥β1∥β1(第一个分式是投影长度,第二个分式是投影方向的单位向量),于是取
β2=α2−∥β1∥2(α2,β1)β1
则 β2 与 β1 正交,同时显然 β2=θ,否则 α1,α2 共线,与 {αi}n 线性无关矛盾。
同理设 β3=α3−c1β1−c2β2,其中 c1,c2 为待定系数,使得 β3 与 β1,β2 都正交,即
(β3,β1)=0⟹(α3−c1β1−c2β2,β1)=0⟹(α3,β1)−c1(β1,β1)−c2(β2,β1)=0⟹(α3,β1)−c1∥β1∥2=0⟹c1=∥β1∥2(α3,β1)
同理可得 c2=∥β2∥2(α3,β2),于是取
β3=α3−∥β1∥2(α3,β1)β1−∥β2∥2(α3,β2)β2
显然 β3 与 β1,β2 都正交,同时 β3=θ。
以此类推,设 βk=αk−c1β1−c2β2−⋯−ck−1βk−1 与 β1,β2,⋯,βk−1 都正交,且 βk=θ,则
(βk,β1)=0⟹(αk−c1β1−c2β2−⋯−ck−1βk−1,β1)=0⟹(αk,β1)−c1(β1,β1)−c2(β2,β1)−⋯−ck−1(βk−1,β1)=0⟹(αk,β1)−c1∥β1∥2=0⟹c1=∥β1∥2(αk,β1)
同理可得 c2=∥β2∥2(αk,β2),⋯,ck−1=∥βk−1∥2(αk,βk−1),于是取
βk=αk−∥β1∥2(αk,β1)β1−∥β2∥2(αk,β2)β2−⋯−∥βk−1∥2(αk,βk−1)βk−1=αk−i=1∑k−1∥βi∥2(αk,βi)βi
碎碎念
最后的公式在 light 模式看不清,主要是因为我自己主要看 dark 模式,而且调一下 light 和 dark 都明显的颜色挺麻烦的,所以就算了。
还是找了一下,根据一个 StackExchange 的回答分别用了 #FF0099
和 #0099FF
,#FF0099
挺完美的,效果很理想,#0099FF
不太行,还稍微牺牲了一下 dark 模式的对比度,只不过 Ta 给的颜色里也没找到更好的了。
我自己改了一下,把 #0099FF
改为了 #82B1F5
,这样就不会牺牲 dark 模式的对比度了,而且 light 模式也不会太难看,唯一有个缺点就是不如 #FF0099
那么醒目,但是我觉得这个缺点可以接受。
若实方阵 A 满足 A⊺A=E,则称 A 为正交矩阵。
对方阵 A,以下表述等价:
- A 为正交矩阵
- A⊺A=E
- A⊺=A−1
- A 的列向量构成法正交组
- A 的行向量构成法正交组
证明:
前三者等价性显然。
(4) (5) ⟹ (1):(这里演示 (4) ⟹ (1),(5) ⟹ (1) 同理)
对于法正交组 {αi}n,设 A=[α1α2⋯αn],则
A⊺=α1⊺α2⊺⋮αn⊺
从而
A⊺A=α1⊺α2⊺⋮αn⊺[α1α2⋯αn]=α1⊺α1α2⊺α1⋮αn⊺α1α1⊺α2α2⊺α2⋮αn⊺α2⋯⋯⋱⋯α1⊺αnα2⊺αn⋮αn⊺αn=10⋮001⋮0⋯⋯⋱⋯00⋮1=E
从而 A 为正交矩阵。
(1) ⟹ (4):(这里演示 (1) ⟹ (4),(1) ⟹ (5) 同理)
设 A 为正交矩阵,即 A⊺A=E,设 A=[α1α2⋯αn],则同理
A⊺Aα1⊺α1α2⊺α1⋮αn⊺α1α1⊺α2α2⊺α2⋮αn⊺α2⋯⋯⋱⋯α1⊺αnα2⊺αn⋮αn⊺αnαi⊺αj=E=10⋮001⋮0⋯⋯⋱⋯00⋮1={1,0,i=ji=j⟹⟹
即 {αi}n 为法正交组。
设二阶方阵
A=[a11a21a12a22]
为正交矩阵,则由 A⊺=A−1 可得
[a11a12a21a22]=∣A∣1[a22−a21−a12a11]
Case 1: ∣A∣=1
从而
{a11a21=a22=−a12
而
∣A∣=a11a22−a12a21=a112+a212=1
从而存在 θ∈[0,2π),使得
{a11a21=cosθ=sinθ
即
A=[cosθsinθ−sinθcosθ]
即 A 代表的线性变换为绕原点逆时针旋转 θ。
Case 2: ∣A∣=−1
从而
{a11a21=−a22=a12
而
∣A∣=a11a22−a12a21=−a112−a212=−1
从而同样存在 θ∈[0,2π),使得
{a11a21=cosθ=sinθ
即
A=[cosθsinθsinθ−cosθ]
则
A=[cosθsinθ−sinθcosθ][100−1]
即 A 代表的线性变换为先关于 x 轴对称(反射),再绕原点逆时针旋转 θ。
旋转矩阵似乎会改变全部向量的方向,也就是说,似乎找不到特征向量。实际上其特征值为复数,特征向量为复向量。
实际上有
{λ1λ2=eiθ=e−iθ
设 A 为 n 阶正交矩阵(正交矩阵要求为实矩阵),λ 为 A 的特征值,α,β∈Rn,则
- A⊺,Ak,A−1,A∗ 也是正交矩阵
- ∣A∣2=1(即 A 的行列式为 ±1)
- (Aα,Aβ)=(α,β)(即 A 保持内积不变,若取 α=β,则 A 保持长度不变,即 ∥Aα∥=∥α∥)
- ∣λ∣=1(即 λ=eiθ,实特征值只能为 ±1)
- 证明:
A⊺,A−1,A∗ 显然。
对于 Ak,有
(Ak)⊺Ak=(AA⋯Ak)⊺AA⋯Ak=A⊺A⊺⋯(A⊺kA⊺A⊺⋯E(A⊺A)(A⊺A)A⋯AA)A⋯Ak⋮=E
- 证明:
A⊺A=E 得
∣A∣2=∣A⊺∣∣A∣=∣E∣=1
- 证明:
(Aα,Aβ)=(Aα)⊺Aβ=α⊺A⊺Aβ=α⊺Eβ=α⊺β=(α,β)
那么同时还有
⟨Aα,Aβ⟩=arccos∥Aα∥∥Aβ∥(Aα,Aβ)=arccos∥α∥∥β∥(α,β)=⟨α,β⟩
- 证明:
设 Aη=λη,其中 η∈Cn\{θ},则
(Aη,Aη)C=(Aη)⊺Aη=η⊺A⊺Aη=η⊺A⊺Aηˉ=η⊺ηˉ=∥η∥2
而
(λη,λη)C=(λη)⊺λη=λλˉη⊺ηˉ=∣λ∣2∥η∥2
从而 ∣λ∣2=1。
考虑 Rn 空间中两个法正交组
A:α1,α2,⋯,αn
与
B:β1,β2,⋯,βn
则存在矩阵 C,使得
B[β1β2⋯βn]=AC=[α1α2⋯αn]c11c21⋮cn1c12c22⋮cn2⋯⋯⋱⋯c1nc2n⋮cnn
那么
C=A−1B
则 C 也是正交矩阵。
实对称矩阵的对角化
若 A 为 n 阶实方阵,且 A⊺=A,则称 A 为实对称矩阵。
实对称矩阵的特征值一定为实数。
证明:
对实对称矩阵 A,设其一特征值为 λ,则存在特征向量 η∈Cn\{θ},即 Aη=λη,等价于证明 λˉ=λ。
{Aη(Aη)⊺=λη=(λη)⊺⟹{Aηˉη⊺A=λˉηˉ=λη⊺
两式分别左乘 η⊺ 和右乘 ηˉ,得
{η⊺Aηˉη⊺Aηˉ=λˉη⊺ηˉ=λη⊺ηˉ=λˉ∥η∥2=λ∥η∥2
从而
λˉ∥η∥2=λ∥η∥2
也即
λˉ=λ
对于 n 阶实对称矩阵 A 与任意向量 α,β∈Rn,有
(Aα,β)=(α,Aβ)
证明:
(Aα,β)=(Aα)⊺β=α⊺A⊺β=α⊺Aβ=(α,Aβ)
实对称矩阵属于不同特征值的特征向量必正交。
即对实对称矩阵 A,若 λ1,λ2 为不同特征值,η1,η2 为对应的特征向量,则 (η1,η2)=0。
由上面有 (Aη1,η2)=(η1,Aη2),
从而 (λ1η1,η2)=(η1,λ2η2),即 (λ1η1,η2)=(λ2η1,η2),从而 (λ1−λ2)(η1,η2)=0,
而 λ1=λ2,从而 (η1,η2)=0。
实对称矩阵必可对角化。
对于实对称矩阵 A∈Mn(R),存在正交矩阵 P,使得 P−1AP=Λ,其中 Λ 为对角矩阵。
证明:
A 有特征值 λ1,λ2,⋯,λn∈R。
对 λ1,存在单位向量 α1∈Rn\{θ} 使得 Aα1=λ1α1,∥α1∥=1。
总能将其扩充为 Rn 的一组法正交组 P1:α1,α2,⋯,αn(总能先扩充为一个向量组⟦上面谈过证明。由于提及的锚点问题,不设置锚点跳转,因为设置也跳转不对⟧,再使用施密特正交化,并单位化)。
则 P1=[α1α2⋯αn] 为正交矩阵。
从而有
AP1=A[α1α2⋯αn]=[Aα1Aα2⋯Aαn]=[λ1α1Aα2⋯Aαn]=[α1α2⋯αn]λ10⋮0a2∗⋮∗⋯⋯⋱⋯an∗⋮∗=P1λ10⋮0a2⋯anA1=P1Q1
则
Q1=P1−1AP1=P1⊺AP1
而
Q1⊺=(P1⊺AP1)⊺=P1⊺A⊺P1=P1⊺AP1=Q1
即 Q1 也为实对称矩阵,从而 a2=a3=⋯=an=0,且 A1 为 n−1 阶实对称矩阵,特征值为 λ2,λ3,⋯,λn。
以此类推,存在正交矩阵 P1,P2,⋯,Pn 使
Pn⊺⋯P2⊺P1⊺AP1P2⋯Pn=Λ
记
P=P1P2⋯Pn
显然 P 也是正交矩阵。则
P⊺AP=Λ
也即
P−1AP=Λ