通过线性变换的对角化,哪怕是对于一些看似非线性代数的问题,只要能按照以下流程,都可以被解决
- 构造出线性空间
- 找到某种条件对应的线性变换
- 通过对角化,用新的语言描述这一条件
- 回推到原问题中给出结果
# 线性递推数列
令 V=RN,即所有实数数列
其中的元(数列)可以表示为(同时也可以作为列向量)
a={an}n∈N=(a1,a2,a3,…)
不难验证,对于任意两个元 a,b∈V,以及任意数 k∈R
- 加法 a+b:={an+bn}n∈N
- 数乘 ka:={kan}n∈N
都仍然属于 V,并且满足线性空间的公理。所以 V 是一个实线性空间
- 零元定义为 0=(0,0,0,…)
任取实数 p,q∈R。定义 V 中拥有基于 p,q 的线性递推式的数列全体
W:={a∈V∣an+2=pan+1+qan,∀n∈N}
显然 0∈W
任取 a,b∈W,则
an+2+bn+2kan+2=pan+1+qan+pbn+1+qbn=p(an+1+bn+1)+q(an+bn)=p(kan+1)+q(kan)
所以 W 在加法与数乘下封闭,成为 V 的子空间
定义数列
{e1:=(1,0,q,pq,p2q+q2,…)e2:=(0,1,p,p2+q,p3+2pq,…)
建立线性方程组
(e1e2)(c1c2)=0
整理等式
⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧c1⋅1+c2⋅0=0c1⋅0+c2⋅1=0c1⋅q+c2⋅p=0⋮
对比前两项不难看出,方程唯一解为 c1=c2=0,所以 e1,e2 线性无关
任取元 w∈W,注意前两项具有如下关系
(e1e2)(w1w2)=(w1w2)
根据 W 的定义,已知数列前两项后即可以唯一确定元 w 的所有项,所以
w=w1e1+w2e2
因此 e1,e2 张成 W
综上所述,E=(e1e2) 构成 W 的一组基底,且 dimW=2
目前该基只反映了基础的递推关系,并没有提供额外信息。为了解决实际问题需要找到更漂亮的基,要求它可以反映出 W 直和分解的构造,为此需要使用对角化
定义映射为去除掉数列的第一项
f:W→W,(a1,a2,a3,…)↦(a2,a3,a4,…)
对于任意的 a,b∈W 以及 k∈R,都有
f(a+b)f(ka)=(a2+b2,a3+b3,…)=f(a)+f(b)=(ka2,ka3,…)=kf(a)
所以 f 是 W 上的线性变换
现计算基的映射值,通过基的坐标可以表示为
f(e1)f(e2)=(0,q,pq,p2q+q2,…)=0⋅e1+q⋅e2=(1,p,p2+q,p3+2pq,…)=1⋅e1+p⋅e2
所以 f 关于基 {e1,e2} 的矩阵表示为
T=(0q1p)
计算特征多项式
FT(λ)=∣∣∣∣∣−λq1p−λ∣∣∣∣∣=λ2−pλ−q
对于特征值 λ,通过解方程 (λE−T)x=0 得出特征多项式
(λ−q−1λ−p)Rref(λ0−10)→p=(1λ)
不失一般性,可以假设解出了两个相异的非零特征值 α,β,则可以得到新的基向量
u1=(e1e2)(1α)=e1+αe2,u2=(e1e2)(1β)=e1+βe2
此时 U:=(u1u2) 也是 W 的一组基底
整理成矩阵形式可以得到
(u1u2)=(e1e2)(1α1β)
所以
P:=(1α1β)
为从基 E 到基 U 的过渡矩阵
这是一个更加漂亮的正交基,因为两个基向量之间互不干涉
根据对角化的计算,可以得到
(u1u2)−1⋅T⋅(u1u2)(f(u1)f(u2))=(α00β)=(u1u2)(α00β)
所以,矩阵
D:=(α00β)
为映射 f 关于基 {u1,u2} 的矩阵表示
f(u1)f(u2)=αu1⟹(u12,u13,u14,…)=(αu11,αu12,αu13,…)=βu2⟹(u22,u23,u24,…)=(βu21,βu22,βu23,…)
解得通项
{u1n=αn−1u11=αn−1u2n=βn−1u21=βn−1
这样一来,通过坐标变换,对于任意的 w∈W,都有
[w]U=P−1[w]E=β−α1(β−α−11)(w1w2)=β−α1(βw1−w2−αw1+w2)
这样一来,代入 U 的基向量通项公式,可以得到数列 w 的通项公式
w⟹wn=β−αβw1−w2u1+β−α−αw1+w2u2=β−αβw1−w2αn−1+β−α−αw1+w2βn−1
示例
求解 Fibonacci 数列
a1=1,a2=1,an+2=an+1+an
的通项公式
解
该例中 p=q=1,特征多项式为
λ2−λ−1=0⟹{α=21+5β=21−5
代入通项公式
an=β−αβ⋅1−1αn−1+β−α−α⋅1+1βn−1=51((21+5)n−(21−5)n)
□
# 线性微分方程
同时含有函数 y=f(x) 及其导数 y′=dxdy 的方程称为 微分方程
令 V:=C∞(R),即所有在实数域上无限可微的函数全体,不难验证其在函数加法与数乘下构成实线性空间
任取实数 p,q∈R。定义 V 中拥有基于 p,q 的线性微分方程全体
W:={y∈V∣dx2d2y=pdxdy+qy}
显然零函数 y=0 属于 W
任取 y1,y2∈W,以及 k∈R,则
dx2d2(y1+y2)dx2d2(ky1)=dx2d2y1+dx2d2y2=pdxdy1+qy1+pdxdy2+qy2=pdxd(y1+y2)+q(y1+y2)=kdx2d2y1=k(pdxdy1+qy1)=pdxd(ky1)+q(ky1)
所以 W 在加法与数乘下封闭,成为 V 的子空间
定义函数 y1,y2∈W,使得
{y1(1)=1,y1′(1)=0y2(1)=0,y2′(1)=1
建立线性方程组
(y1y2)(c1c2)=0
整理等式
⎩⎪⎪⎪⎨⎪⎪⎪⎧c1⋅y1(1)+c2⋅y2(1)=0c1⋅y1′(1)+c2⋅y2′(1)=0⋮
对比前两项不难看出,方程唯一解为 c1=c2=0,所以 y1,y2 线性无关
任取函数 y∈W,则
(y1y2)(y(1)y′(1))=(y(1)y′(1))
根据 W 的递推式定义,将 y 代换为 dxdy 则可以获得 dx3d3y 的取值,依此类推,可以唯一确定 y 的所有阶导数值,所以可以唯一确定函数 y,因此
y=y(1)y1+y′(1)y2
因此 $ {y_1, y_2} $ 张成 W
综上所述,Y=(y1y2) 构成 W 的一组基底,且 dimW=2
现在寻找更漂亮的基
定义映射为求导
f:W→C∞(R),y↦dxdy
对于任意的 y1,y2∈W 以及 k∈R,都有
f(y1+y2)f(ky1)=dxd(y1+y2)=dxdy1+dxdy2=f(y1)+f(y2)=dxd(ky1)=kdxdy1=kf(y1)
所以这是线性映射。
另外,对于任意 y∈W,定义给出 y 满足
dx2d2y=pdxdy+qy
对其两边同时微分,得到
dx2d2(dxdy)=pdxd(dxdy)+qdxdy
这意味着 dxdy∈W,所以 f 是 W 上的线性变换
现计算基的映射值
f(y1)f(y2)=y1′⟹{y1′(1)=0y1′′(1)=p⋅y1′(1)+q⋅y1(1)=q=y2′⟹{y2′(1)=1y2′′(1)=p⋅y2′(1)+q⋅y2(1)=p
所以 f 关于基 Y=(y1y2) 的矩阵表示为
T=(0q1p)
计算特征多项式
FT(λ)=∣∣∣∣∣−λq1p−λ∣∣∣∣∣=λ2−pλ−q
对于特征值 λ,通过解方程 (λE−T)x=0 得出特征多项式
(λ−q−1λ−p)Rref(λ0−10)→p=(1λ)
不失一般性,可以假设解出了两个相异的非零特征值 α,β,则可以得到新的基向量
u1u2=(y1y2)(1α)=y1+αy2,=(y1y2)(1β)=y1+βy2
此时 U:=(u1u2) 也是 W 的一组基底
整理成矩阵形式可以得到
(u1u2)=(y1y2)(1α1β)
所以
P:=(1α1β)
为从基 Y 到基 U 的过渡矩阵
根据对角化的计算,可以得到
(u1u2)−1⋅T⋅(u1u2)(f(u1)f(u2))=(α00β)=(u1u2)(α00β)
所以,矩阵
D:=(α00β)
为映射 f 关于基 {u1,u2} 的矩阵表示
f(u1)f(u2)=αu1⟹(dxdu1)=αu1=βu2⟹(dxdu2)=βu2
对等式两边同时积分,解得通项
∫u11du1∫u21du2=∫αdx⟹ln∣u1∣=αx+C1⟹u1=C1eαx=∫βdx⟹ln∣u2∣=βx+C2⟹u2=C2eβx
由于积分中出现的常数 C1,C2 是任意的,所以任意函数 y∈W 都可以表示为通解
y(x)=C1eαx+C2eβx
通过联立初期方程可以解得常数获得特解。假设初始条件为 a,b,那么
{a=y(0)=C1+C2b=y′(0)=αC1+βC2⟹{C1=α−βb−βaC2=α−βαa−b
示例
求解微分方程
dx2d2y=−5dxdy+6y
满足初始条件
{y(0)=2y′(0)=3
解
特征多项式为
λ2+5λ−6=0⟹{α=1β=−6
代入通项公式
y(x)=C1ex+C2e−6x
联立初期方程可以解得常数
{2=C1+C23=C1−6C2⟹{C1=715C2=−71
所以最终解为
y(x)=715ex−71e−6x
□
# 二次型
任意的二次曲线都可以通过正交矩阵的对角化,改写为标准形式,称为 二次型 (Quadratic Form)「二次形式」
一般的,二次曲线指的是形如
f(x,y)=ax2+bxy+cy2+dx+ey+f=0
的曲线,其中系数 a,b,c,d,e,f∈R,且不全为零
在学习过矩阵后,对任意方程都应该产生联想:是否可以用矩阵表示
定义二次系数矩阵 A,变量矩阵 x,一次系数矩阵 B
A=(a2b2bc),x=(xy),B=(de)
则二次曲线可以表示为
txAx+Bx+f=0
不难看出 A 是实对称矩阵,所以可以由正交矩阵 P 对角化,将上述方程改写为
txPP−1APP−1x+BPP−1x+f=0
令 λ1,λ2 为 A 的特征值,设
BP=(d′e′),P−1x=(x′y′)
则二次曲线可以表示为
λ1x′2+λ2y′2+d′x′+e′y′+f=0
通过配方,可以将其改写为标准形式
λ1X2+λ2Y2+k=0
其中(实际上只需要关注 k 的表达式)
⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧X=x′+2λ1d′Y=y′+2λ2e′k=f−4λ1d′2−4λ2e′2
宏观上,这是通过换元来实现更加漂亮的结构。对角化可以轻松地找出代换的系数
基于初等数学知识,不难看出
- 若 λ1 或者 λ2 有一方为零,则曲线为抛物线
- 若 λ1,λ2 同号
- λ1k<0 时,曲线为椭圆
- λ1k>0 时,曲线为空集
- k=0 时,曲线为单点
- 若 λ1,λ2 异号
- k=0 时,曲线为双曲线
- k=0 时,曲线为两条相交直线
标准型实际上是在维持曲线形状不变的情况下,对坐标系进行旋转与平移,从而得到的更加简洁的表达形式
示例
将二次曲线
5x2+5y2−6xy−262x+222y+66=0
化为标准形式,并指出其类型
解
整理方程为
(xy):=A(5−3−35)(xy)+(−262222)(xy)+66=0
求出 A 的特征值
FA(λ)=∣∣∣∣∣5−λ−3−35−λ∣∣∣∣∣=(5−λ)2−9=λ2−10λ+16=(λ−2)(λ−8)
解得 λ1=2,λ2=8
- 对于 λ1=2,解方程 (λ1E−A)x=0 得出特征向量
(3−3−33)Rref(10−10)→p1=(11)
- 对于 λ2=8,解方程 (λ2E−A)x=0 得出特征向量
(−3−3−3−3)Rref(1010)→p2=(−11)
构造正交矩阵
P=21(11−11)
计算
BPk=(−262222)⋅21(11−11)=66−4⋅2(−4)2−4⋅8482=−8=(−448)
则方程通过配方改写为
2X2+8Y2−8=0
此时特征值同号,且 k<0,所以该二次曲线为椭圆
□