# 矩阵表示

让我们从一类线性映射出发
给定 m×nm \times n 矩阵 AA,定义映射

fA:RnRm,fA(x)=Axf_A: \mathbb R^n \to \mathbb R^m, \quad f_A(\boldsymbol x) = A \boldsymbol x

则容易验证 fAf_A 为线性映射
称这一类线性映射为由矩阵诱导的线性映射

也非常容易验证的是,fAf_A 的核实际上就是齐次方程 Ax=0A \boldsymbol x = \boldsymbol 0 的解空间,而像则是 AA 的列向量的线性结合,也就是说

  • KerfA=N(A),dim(KerfA)=nrank(A)\mathrm{Ker} f_A = N(A),\quad \dim(\mathrm{Ker} f_A) = n - \mathrm{rank}(A)
  • ImfA=C(A),dim(ImfA)=rank(A)\mathrm{Im} f_A = C(A),\quad \dim(\mathrm{Im} f_A) = \mathrm{rank}(A)

那么代入到单射与满射的判定,可以得到

  • fAf_A 为单射 r(A)=n\iff r(A) = n
  • fAf_A 为满射 r(A)=m\iff r(A) = m
  • AA 为方阵,则 单射 \iff 满射 \iff 同构 \iff AA 可逆

也就是说,通过分析矩阵 AA,是完全可以等价于分析 fAf_A 的性质的
实际上矩阵这一数学对象与线性映射之间的交互远远不止于此,自然产生的期望是:任意线性映射是否都可以用矩阵来分析?


V,WV, W 分别为域 F\mathbb F 上的线性空间,且 dimV=n,dimW=m\dim V = n, \dim W = m
线性映射 f:VWf: V \to W
对于这两个线性空间,分别取

  • A={a1,a2,,an}\mathscr A = \{\boldsymbol a_1, \boldsymbol a_2, \ldots, \boldsymbol a_n\}VV 的一组基
  • B={b1,b2,,bm}\mathscr B = \{\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_m\}WW 的一组基

显然,对于 VV 中的基 aj\boldsymbol a_j,线性映射会使它成为 WW 中的元。那么就可以写作 WW 中基底的线性组合形式(注意这里的编号)

f(aj)=k1jb1+k2jb2++kmjbm,j=1,2,,nf(\boldsymbol a_j) = k_{1j} \boldsymbol b_1 + k_{2j} \boldsymbol b_2 + \cdots + k_{mj} \boldsymbol b_m, \quad j = 1, 2, \ldots, n

逐一计算所有 VV 中基底 A\mathscr A 的映射结果,可以得到如下关系

{f(a1)=k11b1+k21b2++km1bmf(a2)=k12b1+k22b2++km2bmf(an)=k1nb1+k2nb2++kmnbm\begin{cases} f(\boldsymbol a_1) = k_{11} \boldsymbol b_1 + k_{21} \boldsymbol b_2 + \cdots + k_{m1} \boldsymbol b_m \\ f(\boldsymbol a_2) = k_{12} \boldsymbol b_1 + k_{22} \boldsymbol b_2 + \cdots + k_{m2} \boldsymbol b_m \\ \quad \vdots \\ f(\boldsymbol a_n) = k_{1n} \boldsymbol b_1 + k_{2n} \boldsymbol b_2 + \cdots + k_{mn} \boldsymbol b_m \end{cases}

将上述等式整理为矩阵形式

(f(a1)f(a2)f(an))1×n=(k11k21km1k12k22km2k1nk2nkmn)n×m(b1b2bm)m×1\begin{pmatrix} f(\boldsymbol a_1) \\ f(\boldsymbol a_2) \\ \vdots \\ f(\boldsymbol a_n) \end{pmatrix}_{1 \times n} = \begin{pmatrix} k_{11} & k_{21} & \cdots & k_{m1} \\ k_{12} & k_{22} & \cdots & k_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ k_{1n} & k_{2n} & \cdots & k_{mn} \end{pmatrix}_{n \times m} \begin{pmatrix} \boldsymbol b_1 \\ \boldsymbol b_2 \\ \vdots \\ \boldsymbol b_m \end{pmatrix}_{m \times 1}

对两边取转置,得到基的格式

(f(a1),f(a2),,f(an))=(b1,b2,,bm)(k11k12k1nk21k22k2nkm1km2kmn)(f(\boldsymbol a_1), f(\boldsymbol a_2), \ldots, f(\boldsymbol a_n)) = (\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_m) \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{m1} & k_{m2} & \cdots & k_{mn} \end{pmatrix}

其中 kijk_{ij} 指示了经由 ff 映射后,VV 中第 jj 个基底在 WW 中第 ii 个基底方向上的分量

称此处出现的矩阵

T=(k11k12k1nk21k22k2nkm1km2kmn)T = \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{m1} & k_{m2} & \cdots & k_{mn} \end{pmatrix}

为线性映射 ff 在基底 A,B\mathscr A, \mathscr B 下的 矩阵表示 (Matrix Representation)「表現行列」

线性映射的矩阵表示如同线性映射的身份信息。
因为矩阵表示 完整描述 了所有与基底有关的变化情况。而任意的向量都可以被基底线性表示出来。
这就意味着:矩阵 TT 实际上决定了 所有 元的映射规则

不难看出,矩阵表示依赖于两个线性空间的基的选择,不同的基底会导致不同的矩阵表示
一般的,由 Fn\mathbb F^nFm\mathbb F^m 的线性映射 ff 在标准基底下的矩阵表示,称为 标准矩阵表示

示例
考虑 R2\mathbb R^2R2\mathbb R^2 的线性变换 RR,基底令为标准基 E={e1,e2}\mathscr E = \{\boldsymbol e_1, \boldsymbol e_2\},取矩阵表示

R(θ)=(sinθcosθcosθsinθ)R(\theta) = \begin{pmatrix} \sin \theta & -\cos \theta \\ \cos \theta & \sin \theta \end{pmatrix}

此线性变换表示将 R2\mathbb R^2 中的向量绕原点逆时针旋转 θ\theta 角度


矩阵表示方便的一点是

  • 可以直接用矩阵积来计算线性映射的复合
  • 可以直接用逆矩阵来计算线性映射的逆映射

命题
令线性映射 f:UV,g:VWf: U \to V, g: V \to W,分别取基底 A,B,C\mathscr A, \mathscr B, \mathscr C,则
ff 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示为 TfT_fgg 在基底 B,C\mathscr B, \mathscr C 下的矩阵表示为 TgT_g,则复合映射 gf:UWg \circ f: U \to W 在基底 A,C\mathscr A, \mathscr C 下的矩阵表示为 Tgf=TgTfT_{g \circ f} = T_g T_f

证明

令基

A=(a1,a2,,an)B=(b1,b2,,bp)C=(c1,c2,,cm)\begin{aligned} \mathscr A &= (\boldsymbol a_1, \boldsymbol a_2, \ldots, \boldsymbol a_n) \\ \mathscr B &= (\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_p) \\ \mathscr C &= (\boldsymbol c_1, \boldsymbol c_2, \ldots, \boldsymbol c_m) \end{aligned}

从矩阵表示的定义出发得到

(f(a1)f(a2)f(an))=(b1b2bp)Tf\begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_p \end{pmatrix} T_f

两边同时经由 gg 映射,得到

(g(f(a1))g(f(a2))g(f(an)))=(g(b1)g(b2)g(bp))Tf\begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix} = \begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix} T_f

又因为根据 gg 的矩阵表示,有

(g(b1)g(b2)g(bp))=(c1c2cm)Tg\begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix} = \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g

将其代入上式,得到

(g(f(a1))g(f(a2))g(f(an)))=(c1c2cm)TgTf\begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix} = \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g T_f

根据矩阵表示的定义,gfg \circ f 在基底 A,C\mathscr A, \mathscr C 下的矩阵表示即为 Tgf=TgTfT_{g \circ f} = T_g T_f
\square

命题
令线性映射 f:VWf: V \to W,分别取基底 A,B\mathscr A, \mathscr B
ff 是可逆的,那么 f1:WVf^{-1}: W \to V 在基底 B,A\mathscr B, \mathscr A 下的矩阵表示为 T_{f^{-1}} = T_f^

证明

因为逆映射的定义得到

ff1=idW,f1f=idVf \circ f^{-1} = \mathrm{id}_W, \quad f^{-1} \circ f = \mathrm{id}_V

所以应用复合映射的结论,得到

TfTf1=Em,Tf1Tf=EnT_f T_{f^{-1}} = E_m, \quad T_{f^{-1}} T_f = E_n

因此 Tf1=Tf1T_{f^{-1}} = T_f^{-1}
\square

  • 注意可逆等价于双射,此时同构给出 dimV=dimW\dim V = \dim W

现在,让我们来讨论一下元素在经由线性映射后,坐标会发生什么样的变化

命题
取线性空间 V,WV, W 的基底 A=(a1,a2,,an),B=(b1,b2,,bm)\mathscr A = (\boldsymbol a_1, \boldsymbol a_2, \ldots, \boldsymbol a_n), \quad \mathscr B = (\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_m),线性映射 f:VWf: V \to W 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示为 TT
对于 vV\boldsymbol v \in V,有

[f(v)]B=T[v]A[f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}

证明

由坐标的定义

v=(a1,a2,,an)[v]A\boldsymbol v = (\boldsymbol a_1, \boldsymbol a_2, \ldots, \boldsymbol a_n)[\boldsymbol v]_{\mathscr A}

将等式两边通过线性映射 ff 映射,可以得到(注意坐标里面的值是常数,提出来)

f(v)=(f(a1),f(a2),,f(an))[v]A=(b1,b2,,bm)T[v]Af(\boldsymbol v) = (f(\boldsymbol a_1), f(\boldsymbol a_2), \ldots, f(\boldsymbol a_n)) [\boldsymbol v]_{\mathscr A} = (\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_m) T \cdot [\boldsymbol v]_{\mathscr A}

同时,f(v)f(\boldsymbol v) 在基底 B\mathscr B 下的坐标定义为

f(v)=(b1,b2,,bm)[f(v)]Bf(\boldsymbol v) = (\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_m) [f(\boldsymbol v)]_{\mathscr B}

即得

[f(v)]B=T[v]A[f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}

\square

注意方向:

  • 基底变换中的结构是 新基底 = 旧基底 × 过渡矩阵
  • 坐标变换中的结构是 新坐标 = 过渡矩阵 × 旧坐标

# 基底变换

VV 为线性空间,取两组基底

  • A={a1,a2,,an}\mathscr A = \{\boldsymbol a_1, \boldsymbol a_2, \ldots, \boldsymbol a_n\} \quad
  • B={b1,b2,,bn}\mathscr B = \{\boldsymbol b_1, \boldsymbol b_2, \ldots, \boldsymbol b_n\} \quad

由于各自都是各自的基底,所以可以用 A\mathscr A 来表示 B\mathscr B,即

bj=k1ja1+k2ja2++knjan,j=1,2,,n\boldsymbol b_j = k_{1j} \boldsymbol a_1 + k_{2j} \boldsymbol a_2 + \cdots + k_{nj} \boldsymbol a_n, \quad j = 1, 2, \ldots, n

将上述等式整理为矩阵形式

(b1b2bn)=(a1a2an)(k11k12k1nk21k22k2nkn1kn2knn)\begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n1} & k_{n2} & \cdots & k_{nn} \end{pmatrix}

从线性映射的角度来说,这无非是一个矩阵表示,令

P=(k11k12k1nk21k22k2nkn1kn2knn)P = \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n1} & k_{n2} & \cdots & k_{nn} \end{pmatrix}

那么由 PP 诱导出的线性映射 fP:VVf_P: V \to V 成为一个线性变换,特别称为 基底变换 (Change of Basis)「基底変換」
将该基地变换的矩阵表示 PP 称为从基底 A\mathscr A 到基底 B\mathscr B过渡矩阵 (Transition Matrix)「変換行列」

由于二者都是基底,可以互相表示,所以逆变换一定存在,并且其矩阵表示也可以由 P1P^{-1} 给出

将基底变换应用到坐标变换的结论中,可以得到

[v]B=P[v]A[\boldsymbol v]_{\mathscr B} = P [\boldsymbol v]_{\mathscr A}

请注意:给出线性映射 f:VWf: V \to W 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示 TT,那么实际上 TT 等价于从 W(B)W(\mathscr B)V(A)V(\mathscr A) 的,由 TT 诱导的线性变换,即

VfWV(A)TW(B)V \xrightarrow{f} W \implies V(\mathscr A) \xleftarrow{T} W(\mathscr B)

示例
R3\mathbb R^3子空间的两组基底

A={a1=(041),a2=(211),},B={b1=(423),b2=(614),}\begin{aligned} \mathscr A &= \left\{ \boldsymbol a_1 = \begin{pmatrix} 0 \\ 4 \\ -1 \end{pmatrix}, \boldsymbol a_2 = \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}, \right\}, \\ \mathscr B &= \left\{ \boldsymbol b_1 = \begin{pmatrix} 4 \\ -2 \\ 3 \end{pmatrix}, \boldsymbol b_2 = \begin{pmatrix} 6 \\ -1 \\ 4 \end{pmatrix}, \right\} \end{aligned}

求从基底 A\mathscr A 到基底 B\mathscr B 的过渡矩阵

求过渡矩阵,等价于求出 B\mathscr B 中的基底在 A\mathscr A 下的表示,这等价于解线性方程组

(a1a2)x=bj,j=1,2\begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix} \boldsymbol x = \boldsymbol b_j, \quad j = 1, 2

构造增广矩阵

P~:=[a1a2b1b2]=(024641211134)\widetilde P := [ \begin{array}{cc|c|c} \boldsymbol a_1 & \boldsymbol a_2 & \boldsymbol b_1 & \boldsymbol b_2 \end{array} ] = \begin{pmatrix} 0 & 2 & 4 & 6 \\ 4 & 1 & -2 & -1 \\ -1 & 1 & 3 & 4 \end{pmatrix}

行化简后得到

Rref(101101230000)\xrightarrow{Rref} \begin{pmatrix} 1 & 0 & -1 & -1 \\ 0 & 1 & 2 & 3 \\ 0 & 0 & 0 & 0 \end{pmatrix}

因此解得

{b1=1a1+2a2b2=1a1+3a2\begin{cases} \boldsymbol b_1 = -1 \boldsymbol a_1 + 2 \boldsymbol a_2 \\ \boldsymbol b_2 = -1 \boldsymbol a_1 + 3 \boldsymbol a_2 \end{cases}

这等价于(一定要注意转置)

(b1b2)=(a1a2)(1123)\begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 \end{pmatrix} = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix} \begin{pmatrix} -1 & -1 \\ 2 & 3 \end{pmatrix}

所以从基底 A\mathscr A 到基底 B\mathscr B 的过渡矩阵为

P=(1123)P = \begin{pmatrix} -1 & -1 \\ 2 & 3 \end{pmatrix}

\square


现在让我们分析一个稍微复杂一些的情况
VV 中分别取两组基底

  • A={v1,v2,,vn}\mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\} \quad
  • A={v1,v2,,vn}\mathscr A' = \{\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n'\} \quad

WW 中分别取两组基底

  • B={w1,w2,,wm}\mathscr B = \{\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m\} \quad
  • B={w1,w2,,wm}\mathscr B' = \{\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m'\} \quad

分别令

  • PP 为从基底 A\mathscr A 到基底 A\mathscr A' 的过渡矩阵
  • QQ 为从基底 B\mathscr B 到基底 B\mathscr B' 的过渡矩阵

取线性映射 T:VWT: V \to W,并且令矩阵 TT 为其在基底 A,B\mathscr A, \mathscr B 下的矩阵表示
请参考如下示意图

V(A)TW(B)PQV(A)?W(B)\begin{array}{ccc} V(\mathscr A) & \xleftarrow{T} & W(\mathscr B) \\ \downarrow P & & \downarrow Q \\ V(\mathscr A') & \xleftarrow{?} & W(\mathscr B') \end{array}

问题:?? 处应当填入什么矩阵,才能使得图式成立?

假设 XX?? 处的矩阵(也就是在基底 A\mathscr A'B\mathscr B' 下的矩阵表示),那么根据定义,以下等式应当成立

(T(v1),T(v2),,T(vn))=(w1,w2,,wm)X(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') X

整理以下已经有的关系式

(v1,v2,,vn)=(v1,v2,,vn)P(w1,w2,,wm)=(w1,w2,,wm)Q(T(v1),T(v2),,T(vn))=(w1,w2,,wm)T\begin{aligned} (\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') &= (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) P \\ (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) Q \\ (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T \end{aligned}

由于将线性映射同时作用于线性变换的两边,可以得到

(T(v1),T(v2),,T(vn))=(T(v1),T(v2),,T(vn))P(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P

注意关系式 (AB)1=B1A1(AB)^{-1} = B^{-1} A^{-1},统合上述所有结果

(T(v1),T(v2),,T(vn))=(T(v1),T(v2),,T(vn))P=(w1,w2,,wm)TP=(w1,w2,,wm)Q1TP\begin{aligned} (T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) &= (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P \\ &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T P \\ &= (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') Q^{-1} T P \end{aligned}

因此可以得到

X=Q1TPX = Q^{-1} T P

命题
令线性变换 f:VWf: V \to W
VV 中取两组基底 A,A\mathscr A, \mathscr A'WW 中取两组基底 B,B\mathscr B, \mathscr B'
分别令 PP 为从基底 A\mathscr A 到基底 A\mathscr A' 的过渡矩阵,QQ 为从基底 B\mathscr B 到基底 B\mathscr B' 的过渡矩阵
若令 ff 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示为 TT
那么 ff 在基底 A,B\mathscr A', \mathscr B' 下的矩阵表示为

T=Q1TPT' = Q^{-1} T P

证明

见上
\square