# 矩阵表示
让我们从一类线性映射出发
给定 m×n 矩阵 A,定义映射
fA:Rn→Rm,fA(x)=Ax
则容易验证 fA 为线性映射
称这一类线性映射为由矩阵诱导的线性映射
也非常容易验证的是,fA 的核实际上就是齐次方程 Ax=0 的解空间,而像则是 A 的列向量的线性结合,也就是说
- KerfA=N(A),dim(KerfA)=n−rank(A)
- ImfA=C(A),dim(ImfA)=rank(A)
那么代入到单射与满射的判定,可以得到
- fA 为单射 ⟺r(A)=n
- fA 为满射 ⟺r(A)=m
- 若 A 为方阵,则 单射 ⟺ 满射 ⟺ 同构 ⟺ A 可逆
也就是说,通过分析矩阵 A,是完全可以等价于分析 fA 的性质的
实际上矩阵这一数学对象与线性映射之间的交互远远不止于此,自然产生的期望是:任意线性映射是否都可以用矩阵来分析?
令 V,W 分别为域 F 上的线性空间,且 dimV=n,dimW=m
线性映射 f:V→W
对于这两个线性空间,分别取
- A={a1,a2,…,an} 为 V 的一组基
- B={b1,b2,…,bm} 为 W 的一组基
显然,对于 V 中的基 aj,线性映射会使它成为 W 中的元。那么就可以写作 W 中基底的线性组合形式(注意这里的编号)
f(aj)=k1jb1+k2jb2+⋯+kmjbm,j=1,2,…,n
逐一计算所有 V 中基底 A 的映射结果,可以得到如下关系
⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧f(a1)=k11b1+k21b2+⋯+km1bmf(a2)=k12b1+k22b2+⋯+km2bm⋮f(an)=k1nb1+k2nb2+⋯+kmnbm
将上述等式整理为矩阵形式
⎝⎜⎜⎜⎜⎛f(a1)f(a2)⋮f(an)⎠⎟⎟⎟⎟⎞1×n=⎝⎜⎜⎜⎜⎛k11k12⋮k1nk21k22⋮k2n⋯⋯⋱⋯km1km2⋮kmn⎠⎟⎟⎟⎟⎞n×m⎝⎜⎜⎜⎜⎛b1b2⋮bm⎠⎟⎟⎟⎟⎞m×1
对两边取转置,得到基的格式
(f(a1),f(a2),…,f(an))=(b1,b2,…,bm)⎝⎜⎜⎜⎜⎛k11k21⋮km1k12k22⋮km2⋯⋯⋱⋯k1nk2n⋮kmn⎠⎟⎟⎟⎟⎞
其中 kij 指示了经由 f 映射后,V 中第 j 个基底在 W 中第 i 个基底方向上的分量
称此处出现的矩阵
T=⎝⎜⎜⎜⎜⎛k11k21⋮km1k12k22⋮km2⋯⋯⋱⋯k1nk2n⋮kmn⎠⎟⎟⎟⎟⎞
为线性映射 f 在基底 A,B 下的 矩阵表示 (Matrix Representation)「表現行列」
线性映射的矩阵表示如同线性映射的身份信息。
因为矩阵表示 完整描述 了所有与基底有关的变化情况。而任意的向量都可以被基底线性表示出来。
这就意味着:矩阵 T 实际上决定了 所有 元的映射规则
不难看出,矩阵表示依赖于两个线性空间的基的选择,不同的基底会导致不同的矩阵表示
一般的,由 Fn 到 Fm 的线性映射 f 在标准基底下的矩阵表示,称为 标准矩阵表示
示例
考虑 R2 到 R2 的线性变换 R,基底令为标准基 E={e1,e2},取矩阵表示
R(θ)=(sinθcosθ−cosθsinθ)
此线性变换表示将 R2 中的向量绕原点逆时针旋转 θ 角度
矩阵表示方便的一点是
- 可以直接用矩阵积来计算线性映射的复合
- 可以直接用逆矩阵来计算线性映射的逆映射
命题
令线性映射 f:U→V,g:V→W,分别取基底 A,B,C,则
设 f 在基底 A,B 下的矩阵表示为 Tf,g 在基底 B,C 下的矩阵表示为 Tg,则复合映射 g∘f:U→W 在基底 A,C 下的矩阵表示为 Tg∘f=TgTf
证明
令基
ABC=(a1,a2,…,an)=(b1,b2,…,bp)=(c1,c2,…,cm)
从矩阵表示的定义出发得到
(f(a1)f(a2)⋯f(an))=(b1b2⋯bp)Tf
两边同时经由 g 映射,得到
(g(f(a1))g(f(a2))⋯g(f(an)))=(g(b1)g(b2)⋯g(bp))Tf
又因为根据 g 的矩阵表示,有
(g(b1)g(b2)⋯g(bp))=(c1c2⋯cm)Tg
将其代入上式,得到
(g(f(a1))g(f(a2))⋯g(f(an)))=(c1c2⋯cm)TgTf
根据矩阵表示的定义,g∘f 在基底 A,C 下的矩阵表示即为 Tg∘f=TgTf
□
命题
令线性映射 f:V→W,分别取基底 A,B
若 f 是可逆的,那么 f−1:W→V 在基底 B,A 下的矩阵表示为 T_{f^{-1}} = T_f^
证明
因为逆映射的定义得到
f∘f−1=idW,f−1∘f=idV
所以应用复合映射的结论,得到
TfTf−1=Em,Tf−1Tf=En
因此 Tf−1=Tf−1
□
- 注意可逆等价于双射,此时同构给出 dimV=dimW
现在,让我们来讨论一下元素在经由线性映射后,坐标会发生什么样的变化
命题
取线性空间 V,W 的基底 A=(a1,a2,…,an),B=(b1,b2,…,bm),线性映射 f:V→W 在基底 A,B 下的矩阵表示为 T
对于 v∈V,有
[f(v)]B=T[v]A
证明
由坐标的定义
v=(a1,a2,…,an)[v]A
将等式两边通过线性映射 f 映射,可以得到(注意坐标里面的值是常数,提出来)
f(v)=(f(a1),f(a2),…,f(an))[v]A=(b1,b2,…,bm)T⋅[v]A
同时,f(v) 在基底 B 下的坐标定义为
f(v)=(b1,b2,…,bm)[f(v)]B
即得
[f(v)]B=T[v]A
□
注意方向:
- 基底变换中的结构是 新基底 = 旧基底 × 过渡矩阵
- 坐标变换中的结构是 新坐标 = 过渡矩阵 × 旧坐标
# 基底变换
令 V 为线性空间,取两组基底
- A={a1,a2,…,an}
- B={b1,b2,…,bn}
由于各自都是各自的基底,所以可以用 A 来表示 B,即
bj=k1ja1+k2ja2+⋯+knjan,j=1,2,…,n
将上述等式整理为矩阵形式
(b1b2⋯bn)=(a1a2⋯an)⎝⎜⎜⎜⎜⎛k11k21⋮kn1k12k22⋮kn2⋯⋯⋱⋯k1nk2n⋮knn⎠⎟⎟⎟⎟⎞
从线性映射的角度来说,这无非是一个矩阵表示,令
P=⎝⎜⎜⎜⎜⎛k11k21⋮kn1k12k22⋮kn2⋯⋯⋱⋯k1nk2n⋮knn⎠⎟⎟⎟⎟⎞
那么由 P 诱导出的线性映射 fP:V→V 成为一个线性变换,特别称为 基底变换 (Change of Basis)「基底変換」
将该基地变换的矩阵表示 P 称为从基底 A 到基底 B 的 过渡矩阵 (Transition Matrix)「変換行列」
由于二者都是基底,可以互相表示,所以逆变换一定存在,并且其矩阵表示也可以由 P−1 给出
将基底变换应用到坐标变换的结论中,可以得到
[v]B=P[v]A
请注意:给出线性映射 f:V→W 在基底 A,B 下的矩阵表示 T,那么实际上 T 等价于从 W(B) 到 V(A) 的,由 T 诱导的线性变换,即
VfW⟹V(A)TW(B)
示例
取 R3 的子空间的两组基底
AB=⎩⎪⎨⎪⎧a1=⎝⎛04−1⎠⎞,a2=⎝⎛211⎠⎞,⎭⎪⎬⎪⎫,=⎩⎪⎨⎪⎧b1=⎝⎛4−23⎠⎞,b2=⎝⎛6−14⎠⎞,⎭⎪⎬⎪⎫
求从基底 A 到基底 B 的过渡矩阵
解
求过渡矩阵,等价于求出 B 中的基底在 A 下的表示,这等价于解线性方程组
(a1a2)x=bj,j=1,2
构造增广矩阵
P:=[a1a2b1b2]=⎝⎛04−12114−236−14⎠⎞
行化简后得到
Rref⎝⎛100010−120−130⎠⎞
因此解得
{b1=−1a1+2a2b2=−1a1+3a2
这等价于(一定要注意转置)
(b1b2)=(a1a2)(−12−13)
所以从基底 A 到基底 B 的过渡矩阵为
P=(−12−13)
□
现在让我们分析一个稍微复杂一些的情况
在 V 中分别取两组基底
- A={v1,v2,…,vn}
- A′={v1′,v2′,…,vn′}
在 W 中分别取两组基底
- B={w1,w2,…,wm}
- B′={w1′,w2′,…,wm′}
分别令
- P 为从基底 A 到基底 A′ 的过渡矩阵
- Q 为从基底 B 到基底 B′ 的过渡矩阵
取线性映射 T:V→W,并且令矩阵 T 为其在基底 A,B 下的矩阵表示
请参考如下示意图
V(A)↓PV(A′)T?W(B)↓QW(B′)
问题:? 处应当填入什么矩阵,才能使得图式成立?
假设 X 为 ? 处的矩阵(也就是在基底 A′ 和 B′ 下的矩阵表示),那么根据定义,以下等式应当成立
(T(v1′),T(v2′),…,T(vn′))=(w1′,w2′,…,wm′)X
整理以下已经有的关系式
(v1′,v2′,…,vn′)(w1′,w2′,…,wm′)(T(v1),T(v2),…,T(vn))=(v1,v2,…,vn)P=(w1,w2,…,wm)Q=(w1,w2,…,wm)T
由于将线性映射同时作用于线性变换的两边,可以得到
(T(v1′),T(v2′),…,T(vn′))=(T(v1),T(v2),…,T(vn))P
注意关系式 (AB)−1=B−1A−1,统合上述所有结果
(T(v1′),T(v2′),…,T(vn′))=(T(v1),T(v2),…,T(vn))P=(w1,w2,…,wm)TP=(w1′,w2′,…,wm′)Q−1TP
因此可以得到
X=Q−1TP
命题
令线性变换 f:V→W
V 中取两组基底 A,A′,W 中取两组基底 B,B′
分别令 P 为从基底 A 到基底 A′ 的过渡矩阵,Q 为从基底 B 到基底 B′ 的过渡矩阵
若令 f 在基底 A,B 下的矩阵表示为 T
那么 f 在基底 A′,B′ 下的矩阵表示为
T′=Q−1TP
证明