对角化非常强大,它可以抽取出线性映射中最漂亮的基,洞察空间的真实结构
但是对角化具有非常多的限制条件,例如现在已知对于 n 阶方阵来说
- 需要有 n 个线性无关的特征向量才可以对角化
- 需要是实对称矩阵才可以通过正交矩阵对角化
- 需要是 Hermitian 矩阵才可以通过酉矩阵对角化
那么有没有某一种变化,它的功效稍微低一些,但是可以对任意方阵执行呢?
定理 上三角化定理
令 A 为 F 上的 n 阶方阵,且 λ1,λ2,…,λn 为 A 在 F 上的全部特征值(重根按重数计算)
此时,存在正则矩阵 P,使得
P−1AP=⎝⎜⎜⎜⎜⎜⎜⎛λ100⋮0∗λ20⋮0∗∗λ3⋮0⋯⋯⋯⋱⋯∗∗∗⋮λn⎠⎟⎟⎟⎟⎟⎟⎞
证明
利用数学归纳法证明该结论
当 n=1 时,结论显然成立
假设当矩阵阶数为 k 时结论成立,现考虑 k+1 阶矩阵 A
由于 F 上 A 存在特征值 λ1,取对应的特征向量 v1,并将其扩展为 k+1 维空间的基底
(v1v2⋯vk+1)
在该基底下,线性变换 TA 的矩阵表示为
[TA]B=⎝⎜⎜⎜⎜⎜⎜⎛λ100⋮0∗∗A′⋯∗⎠⎟⎟⎟⎟⎟⎟⎞
其中 A′ 为 k 阶矩阵,且 A′ 在 F 上的全部特征值为 λ2,λ3,…,λk+1
根据归纳假设,存在正则矩阵 Q,使得
Q−1A′Q=⎝⎜⎜⎜⎜⎜⎜⎛λ200⋮0∗λ30⋮0∗∗λ4⋮0⋯⋯⋯⋱⋯∗∗∗⋮λk+1⎠⎟⎟⎟⎟⎟⎟⎞
令
P=⎝⎜⎜⎜⎜⎜⎜⎛100⋮000Q⋯0⎠⎟⎟⎟⎟⎟⎟⎞
则
P−1AP=⎝⎜⎜⎜⎜⎜⎜⎛λ100⋮0∗λ20⋮0∗∗λ3⋮0⋯⋯⋯⋱⋯∗∗∗⋮λk+1⎠⎟⎟⎟⎟⎟⎟⎞
因此结论对 k+1 阶矩阵亦成立,归纳完毕。
□
可以看出,上三角化并没有对角化那么漂亮,最根本的原因在于这不是唯一的。上三角化得到的矩阵中有多个不唯一的元素
所以,尽可能的在上三角化中,选取某一类固定的,漂亮的矩阵作为唯一分解结果,这样一来对任意矩阵都可以得到一个上三角的标准形式
# 广义特征空间
在经过对角化的学习后,应该要能看出对角化的本质是对线性空间执行的直和分解。分解的基本单位是特征空间。
而只有在特征空间的维数和等于该空间的维数时,这个分解才可以执行。为了找到一般矩阵的 “对角化”,首先需要克服的问题就是直和分解
作为代替,我们来证明 Fn 时常可以被分解为广义特征空间的直和
- 不要忘记之前的结论:任意一个定义在 F 上的 n 维线性空间 V 与 Fn 同构
定义
令 V 为 n 维线性空间,f:V→V 为线性变换,λ∈F 为 f 的特征值
定义 V 上的线性变换
φλ:=f−λidV:V→V
称
W:={v∈V∣φλn(v)=0}
为线性变换 f 关于特征值 λ 的 广义特征空间 (Generalized Eigenspace)「広義固有空間」。
- 本质上可以看出 W=Ker(φλn),所以 W 确实是 V 的子空间
如果对原本的线性变换进行限制,即
f∣W:W→W
那么因为
(φλ∘f)(v)=f(f(v))−λf(v)=f(f(v))−f(λv)=(f∘φλ)(v)
注意到 φλn(v)=0,所以
φλn∘f=f∘φλn
那么
(φλn∘f)(v)=(f∘φλn)(v)=f(0)=0
这意味着 f(v)∈W,也就是说 f∣W 也是 W 上的线性变换
在执行广义特征空间的直和分解之前,首先需要确定其直和结构
命题
令 λ1,λ2,…,λk 为线性变换 f:V→V 在 F 上的全部不同特征值,则
Wλ1+Wλ2+⋯+Wλk=Wλ1⊕Wλ2⊕⋯⊕Wλk
证明
基于归纳法证明
当 k=1 时,结论显然成立
假设当 k=m 时结论成立,现考虑 k=m+1 的情形
取任意 v∈Wλ1+Wλ2+⋯+Wλm+1,则存在 vi∈Wλi,使得
v=i=1∑m+1vi
应用归纳假设,有
i=1∑mvi=w1+w2
其中 w1∈Wλ1⊕Wλ2⊕⋯⊕Wλm,w2∈Wλm+1
所以
v=w1+(w2+vm+1)
注意到 Wλm+1 为子空间,所以 w2+vm+1∈Wλm+1,因此
v∈Wλ1⊕Wλ2⊕⋯⊕Wλm+1
反之亦然,所以
Wλ1+Wλ2+⋯+Wλm+1=Wλ1⊕Wλ2⊕⋯⊕Wλm+1
□
定理 ** 广义特征空间直和分解
令 V 为 F 上的 n 维线性空间,f:V→V 为线性变换,设 f 的特征多项式形如
Ff(λ)=(λ−λ1)n1(λ−λ2)n2⋯(λ−λk)nk
则
V=Wλ1⊕Wλ2⊕⋯⊕Wλk
其中
dimWλi=ni
证明
对 1≤i≤k,令
gi(λ)=(λ−λi)niFA(λ)
由 Cayley–Hamilton 定理,得到对于任意 v∈V,有
FA(A)v=(A−λiE)nigi(A)v=0
所以 g_i(A) \boldsymbol v \in \widetilde W_
取任意 v∈V,则存在多项式 hi(λ),使得
i=1∑khi(λ)gi(λ)=1
因此
v=i=1∑khi(A)gi(A)v
注意到 gi(A)v∈Wλi,所以 v∈∑i=1kWλi,从而
V=i=1∑kWλi=Wλ1⊕Wλ2⊕⋯⊕Wλk
接下来证明 dimWλi=ni。
取 Wλi 上的任意基
(w1iw2i⋯wmi′i)
通过对 1≤i≤k 进行排列,可以得到 V 上的基
使用这个基下,线性变换 f 的矩阵表示为
[f]B=⎝⎜⎜⎜⎜⎜⎜⎛A100⋮00A20⋮000A3⋮0⋯⋯⋯⋱⋯000⋮Ak⎠⎟⎟⎟⎟⎟⎟⎞
其中各个 Ai 为 Wλi 上的线性变换 f∣Wλi 的矩阵表示
由于每个 Ai 的特征多项式均为 (λ−λi)mi′,所以
FA(λ)=i=1∏k(λ−λi)mi′
又由于特征多项式的唯一性,得到 mi′=ni,从而 dimWλi=ni
□
# Jordan 标准化
完成了直和分解的理论结构后,就可以进行对变换的构造了
定义
对于任意的数 λ∈F,以及正整数 n∈N,称 n 阶矩阵
Jn(λ)=⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛λ00⋮001λ0⋮0001λ⋮00⋯⋯⋯⋱⋯⋯000⋮1λ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞
为 Jordan 块 (Jordan Block)「ジョルダン細胞」。
将多个 Jordan 块沿对角线排列起来,就可以得到 Jordan 矩阵 (Jordan Matrix)「ジョルダン行列」。
J=⎝⎜⎜⎜⎜⎜⎜⎛Jn1(λ1)00⋮00Jn2(λ2)0⋮000Jn3(λ3)⋮0⋯⋯⋯⋱⋯000⋮Jnk(λk)⎠⎟⎟⎟⎟⎟⎟⎞
- 该矩阵阶为 ∑i=1kni
如果一个 Jordan 矩阵中,所有 Jordan 块的特征值均为相同的 λ,则称该 Jordan 矩阵为 λ-Jordan 矩阵,记为 Jλ
令 V 为 F 上的 n 维线性空间,f:V→V 为线性变换,λ 为 f 的特征值
回忆到 f∣Wλ 为 Wλ 上的线性变换,设其标准矩阵为 Aλ,设 dimWλ=nλ
令 φλ:=f∣Wλ−λidWλ 的标准矩阵为 Nλ
则特征空间满足
Wλ={v∈V∣Nλnv=0}
取 v∈Wλ,使得 Nλnλv=0,构造向量组
(vNλvNλ2v⋯Nλnλ−1v)
命题
若所有向量非零,则
N={v,Nλv,Nλ2v,…,Nλnλ−1v}
构成 Wλ 的基
证明
设存在系数 a0,a1,…,anλ−1∈F,使得
a0v+a1Nλv+a2Nλ2v+⋯+anλ−1Nλnλ−1v=0
应用 Nλnλ−1 于上式,得到
a0Nλnλ−1v=0
由于 Nλnλ−1v=0,所以 a0=0
类似地,依次应用 Nλnλ−2,Nλnλ−3,…,Nλ0,可以得到 a1=a2=⋯=anλ−1=0
因此,向量组 N 线性无关
又由于 Wλ 的维数为 nλ,所以 N 构成 Wλ 的基
□
不妨假设上述向量组中的所有向量均非零,那么就可以构造出 Wλ 的基 N
符号上,令
⎩⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎧e1:=ve2:=Nλve3:=Nλ2v⋮enλ:=Nλnλ−1v
显然,此时具有映射关系链
enλNλenλ−1Nλenλ−2Nλ⋯Nλe2Nλe1Nλ0
回看矩阵 Aλ 在基底 N 下的表现:
Ae1Ae2Ae3Aenλ=λe1=e1+λe2=e2+λe3⋮=enλ−1+λenλ
因此,矩阵 Aλ 在基底 N 下的矩阵表示为
(vNλv⋯Nλnλ−1v)−1Aλ(vNλv⋯Nλnλ−1v)=⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛λ00⋮001λ0⋮0001λ⋮00⋯⋯⋯⋱⋯⋯000⋮1λ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞
这正是我们想要寻找的 Jordan 矩阵。
对每一个特征值 λi,都可以通过类似的方式构造出 Wλi 上的 Jordan 矩阵 Jλi
再通过广义特征空间的直和分解,就可以得到整个空间 V 上的 Jordan 矩阵表示
定理 Jordan 标准型定理
对于任意 n 阶方阵 A,令其特征多项式为
FA(λ)=(λ−λ1)n1(λ−λ2)n2⋯(λ−λk)nk
则存在正则矩阵 P,使得
P−1AP=⎝⎜⎜⎜⎜⎜⎜⎛J100⋮00J20⋮000J3⋮0⋯⋯⋯⋱⋯000⋮Jk⎠⎟⎟⎟⎟⎟⎟⎞
其中,各个 Ji 为 Jordan 矩阵
Ji=⎝⎜⎜⎜⎜⎜⎜⎛Jλi(ℓ1i)00⋮00Jλi(ℓ2i)0⋮000Jλi(ℓ3i)⋮0⋯⋯⋯⋱⋯000⋮Jλi(ℓmii)⎠⎟⎟⎟⎟⎟⎟⎞,j=1∑niℓji=ni
该分解在 Jordan 块的排列顺序上唯一
证明
由此,求解矩阵的 Jordan 标准化的流程为
- 计算矩阵的特征多项式,并分解出全部特征值及其重数
- 对于每一个特征值 λi,计算各个 (A−λiI)p 的秩,从而计算出各个阶数的 Jordan 块数量
- 将各个 Jordan 块沿对角线排列起来,得到 Jordan 矩阵
- 计算出相应的相似变换矩阵 P,从而完成 Jordan 标准化
示例
计算矩阵
A=⎝⎛−65−7−76−92−21⎠⎞
的 Jordan 标准型。
解
首先,计算矩阵 A 的特征多项式
FA(λ)=det(λE−A)=∣∣∣∣∣∣∣λ+6−577λ−69−22λ−1∣∣∣∣∣∣∣=(λ+1)2(λ−3)
因此,根据特征根的重数
dimW−1=2,dimW3=1
(1) 对于特征值 λ1=3,解方程 (A−3E)x=0,得到特征向量,同时也是 W3 的基
v1=⎝⎛1−11⎠⎞
(2) 对于特征值 λ2=−1,注意该空间维度为 2,所以需要解出满足 (A+E)2x=0 的向量,得到
v2=⎝⎛−430⎠⎞,v3=⎝⎛103⎠⎞
构造 W−1 的基,其中 v3=(A+E)v2
(v2v3)=⎝⎛⎝⎛−430⎠⎞⎝⎛−111⎠⎞⎠⎞
计算各个基向量在 A 下的映射
Av1Av2Av3=3v1=−v2=v2−v3
构造相似变换矩阵
P=(v2v3v1)=⎝⎛−430−1111−11⎠⎞
因此,
P−1AP=⎝⎛3000−1001−1⎠⎞
□