特征值与特征向量
定义
一些向量在经过矩阵的线性变换后,仍然保有原来的方向,使得这些向量像是只进行了伸缩变换一样。我们便将这些向量称为矩阵的特征向量,而这些向量所对应的伸缩比例便是矩阵的特征值。
根据定义,我们可以得到矩阵的特征向量和特征值的定义式:
Aη=λη
其中,η 为特征向量,λ 为特征值。
显然 η=θ,那么
Aη−λEη(A−λE)η=0=0
既然这个齐次线性方程组有非零解 η,那么系数矩阵 A−λE 的行列式必然为零,即
∣A−λE∣=0
课本上比较常用 ∣λE−A∣=0。不过因为实际用时用课本的表示方式需要将矩阵元素取负,容易出错,所以这里采用了另一种表示方式。
这个方程称为矩阵 A 的特征方程,它是一个关于 λ 的 n 次多项式,称为特征多项式,方程的解称为特征根。解这个方程,就可以得到矩阵 A 的所有特征值。
把特征值代入特征方程,就可以得到对应的特征向量。
意义
为什么我们要研究伸缩变换,因为伸缩变换真的很好啊!
如果矩阵只进行伸缩变换,那么只需要将原向量各基向量进行对应的伸缩变换,就可以得到经过矩阵线性变换向量的结果。同样地,如果矩阵只进行伸缩变换,矩阵的乘法也就非常简单了。
只进行伸缩变换的矩阵形如
λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn
对第 i 个基向量进行 λi 倍的伸缩变换。
然而遗憾的是,大部分矩阵并不止进行伸缩变换。
我们可以设想,在经过某个线性变换后,一个一般的矩阵 A 变成了一个新矩阵 Λ,这个矩阵只进行伸缩变换,因此就可以方便地进行线性变换。然而这是在另一个向量空间进行的变换,我们还需要将结果「翻译」回原来的向量空间,即再乘以那个线性变换的逆变换。翻译成数学语言就是
A=PΛP−1
也即 AP=PΛ。
不妨设 P=[η1η2⋯ηn],那么
AP=A[η1η2⋯ηn]=[Aη1Aη2⋯Aηn]
而
PΛ=[η1η2⋯ηn]λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn=[λ1η1λ2η2⋯λnηn]
因此
⎩⎨⎧Aη1Aη2⋮Aηn=λ1η1=λ2η2=λnηn
也就是说,要解 Aη=λη,即解特征方程。这也从另一个角度提供了特征值的意义。
有了 A=PΛP−1,就可以比较方便地计算矩阵的幂:
An=(PΛP−1)n=(PΛP−1)(PΛP−1)⋯(PΛP−1)n=PΛP−1PΛP−1⋯PΛP−1n=PΛΛ⋯ΛnP−1=PΛnP−1
计算
计算特征向量时,对于重根的特征值,往往会出现多个解向量。可以证明,任取 k 个特征值 λ1,λ2,⋯,λk,对应的特征向量 η1,η2,⋯,ηk,那么这 k 个特征向量线性无关。
证明:
即证 r{η1,⋯,ηk}=k。
反证法,设 r{η1,⋯,ηk}=s⩽k−1,那么不妨设 η1,⋯,ηs 为一个极大无关组,从而 ∃k1,⋯,ks,
ηs+1=k1η1+⋯+ksηs(1)
那么
Aηs+1λs+1ηs+1=A(k1η1+⋯+ksηs)=k1Aη1+⋯+ksAηs=k1λ1η1+⋯+ksλsηs(2)
λs+1(1)−(2) 得
k1(λs+1−λ1)η1+⋯+ks(λs+1−λs)ηs=θ
既然 η1,⋯,ηs 为一个极大无关组。那么其系数必然全为零。又由于 λ 的任意性,从而 k1=⋯=ks=0,于是 ηs+1=θ,与 ηs+1 为特征向量矛盾。
因此 r{η1,⋯,ηk}=k,即 η1,⋯,ηk 线性无关。
这不意味着重根数 = 对应特征矩阵基础解系向量的个数。
如 A=[1011],有 ∣λE−A∣=(λ−1)2 有重根 λ=1,但是只有一个特征向量 η=k[10](k=0)。
性质
A↔B⟺A,B 有相同特征多项式。
证明:
fB(λ)=∣λE−B∣=λE−P−1AP=P−1λEP−P−1AP=P−1(λE−A)P=P−1∣λE−A∣∣P∣=∣λE−A∣=fA(λ)
设 f(x) 为关于 x 的多项式,若 λ 为 A 的特征值,f(λ) 为 f(A) 的特征值。
i=1∏nλi=∣An∣
证明:
∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋱⋯−a1n−a2n⋮λ−ann=λn+cn−1λn−1+⋯+c1λ+c0=i=1∏n(λ−λi)
从而有 c0=(−1)ni=1∏nλi。
令 λ=0,得 c0=∣−A∣=(−1)n∣An∣,即
i=1∏nλi=∣An∣
定义方阵的迹为主对角线上元素之和,记作 tr(A)。
i=1∑nλi=tr(An)
证明:
按行展开,有
∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋱⋯−a1n−a2n⋮λ−ann=(λ−a11)A11+(−1)1+2(−a12)A12+⋯+(−1)1+n(−a1n)A1n
而 A12,⋯,A1n 中 λ 的次数最高为 n−2,于是可以不用考虑,同理有
∣λE−A∣==(λ−a11)A11(λ−a11)(λ−a22)⋯(λ−ann)+dn−2λn−2+⋯+d1λ+d0
则 λn−1 的系数为 −i=1∑naii=tr(A),而 ∣λE−A∣=i=1∏n(λ−λi),从而还有 λn−1 的系数为 −i=1∑nλi,于是有
i=1∑nλi=tr(An)
设 A∈Rm×n,B∈Rn×m,则有
λn∣λEm−AB∣=λm∣λEn−BA∣
证明:
注意到
⎩⎨⎧λn∣λEm−AB∣=λEm−ABλEnλm∣λEn−BA∣=λEmλEn−BA=λEm+n−[ABOn]=λEm+n−[OmBA]
即证
λEm+n−[ABOn]=λEm+n−[OmBA]
而
⎩⎨⎧[ABOn][OmBA]=[OOAO][OBOO]=[OBOO][AOOO]
而「若 A,B 为同阶方阵,则有 AB 与 BA 特征值相同」,得证。
由此可知 m 阶方阵 AB 与 n 阶方阵 BA 的特征值相同,且相同的非零特征值的代数重数相同(即 tr(AB)=tr(BA))。
若 Aη=λη,则 A−1η=λ1η。
即 A 的特征向量 η 也是 A−1 的特征向量,且特征值互为倒数。