# 矩阵表示

让我们从一类线性映射出发
给定 $m \times n$ 矩阵 $A$ ，定义映射

$f_A: \mathbb R^n \to \mathbb R^m, \quad f_A(\boldsymbol x) = A \boldsymbol x$

则容易验证 $f_A$ 为线性映射
称这一类线性映射为由矩阵诱导的线性映射

也非常容易验证的是， $f_A$ 的核实际上就是齐次方程 $A \boldsymbol x = \boldsymbol 0$ 的解空间，而像则是 $A$ 的列向量的线性结合，也就是说

$\mathrm{Ker} f_A = N(A),\quad \dim(\mathrm{Ker} f_A) = n - \mathrm{rank}(A)$
$\mathrm{Im} f_A = C(A),\quad \dim(\mathrm{Im} f_A) = \mathrm{rank}(A)$

那么代入到单射与满射的判定，可以得到

$f_A$ 为单射 $\iff r(A) = n$
$f_A$ 为满射 $\iff r(A) = m$
若 $A$ 为方阵，则单射 $\iff$ 满射 $\iff$ 同构 $\iff$ $A$ 可逆

也就是说，通过分析矩阵 $A$ ，是完全可以等价于分析 $f_A$ 的性质的
实际上矩阵这一数学对象与线性映射之间的交互远远不止于此，自然产生的期望是：任意线性映射是否都可以用矩阵来分析？

令 $V, W$ 分别为域 $\mathbb F$ 上的线性空间，且 $\dim V = n, \dim W = m$
线性映射 $f: V \to W$
对于这两个线性空间，分别取

$\mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix}$ 为 $V$ 的一组基
$\mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix}$ 为 $W$ 的一组基

显然，对于 $V$ 中的基 $\boldsymbol a_j$ ，线性映射会使它成为 $W$ 中的元。那么就可以写作 $W$ 中基底的线性组合形式（注意这里的编号）

$f(\boldsymbol a_j) = k_{1j} \boldsymbol b_1 + k_{2j} \boldsymbol b_2 + \cdots + k_{mj} \boldsymbol b_m, \quad j = 1, 2, \ldots, n$

逐一计算所有 $V$ 中基底 $\mathscr A$ 的映射结果，可以得到如下关系

$\begin{cases} f(\boldsymbol a_1) = k_{11} \boldsymbol b_1 + k_{21} \boldsymbol b_2 + \cdots + k_{m1} \boldsymbol b_m \\ f(\boldsymbol a_2) = k_{12} \boldsymbol b_1 + k_{22} \boldsymbol b_2 + \cdots + k_{m2} \boldsymbol b_m \\ \quad \vdots \\ f(\boldsymbol a_n) = k_{1n} \boldsymbol b_1 + k_{2n} \boldsymbol b_2 + \cdots + k_{mn} \boldsymbol b_m \end{cases}$

将上述等式整理为矩阵形式

$\begin{pmatrix} f(\boldsymbol a_1) \\ f(\boldsymbol a_2) \\ \vdots \\ f(\boldsymbol a_n) \end{pmatrix}_{1 \times n} = \begin{pmatrix} k_{11} & k_{21} & \cdots & k_{m1} \\ k_{12} & k_{22} & \cdots & k_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ k_{1n} & k_{2n} & \cdots & k_{mn} \end{pmatrix}_{n \times m} \begin{pmatrix} \boldsymbol b_1 \\ \boldsymbol b_2 \\ \vdots \\ \boldsymbol b_m \end{pmatrix}_{m \times 1}$

对两边取转置，得到基的格式

$\begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{m1} & k_{m2} & \cdots & k_{mn} \end{pmatrix}$

其中 $k_{ij}$ 指示了经由 $f$ 映射后， $V$ 中第 $j$ 个基底在 $W$ 中第 $i$ 个基底方向上的分量

称此处出现的矩阵

$T = \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{m1} & k_{m2} & \cdots & k_{mn} \end{pmatrix}$

为线性映射 $f$ 在基底 $\mathscr A, \mathscr B$ 下的 矩阵表示 (Matrix Representation)「表現行列」

请注意左右两侧都是 $W$ 中的基

线性映射的矩阵表示如同线性映射的身份信息。
因为矩阵表示完整描述了所有与基底有关的变化情况。而任意的向量都可以被基底线性表示出来。
这就意味着：矩阵 $T$ 实际上决定了所有元的映射规则

不难看出，矩阵表示依赖于两个线性空间的基的选择，不同的基底会导致不同的矩阵表示
一般的，由 $\mathbb F^n$ 到 $\mathbb F^m$ 的线性映射 $f$ 在标准基底下的矩阵表示，称为标准矩阵表示

示例
考虑 $\mathbb R^2$ 到 $\mathbb R^2$ 的线性变换 $R$ ，基底令为标准基 $\mathscr E = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix}$ ，取矩阵表示

$R(\theta) = \begin{pmatrix} \sin \theta & -\cos \theta \\ \cos \theta & \sin \theta \end{pmatrix}$

此线性变换表示将 $\mathbb R^2$ 中的向量绕原点逆时针旋转 $\theta$ 角度

一般地，对于由 $A$ 诱导出的线性映射 $f_A: V \to W$

取 $V$ 的标准基底 \mathscr E = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end
取 $W$ 的标准基底 \mathscr E' = \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end

则

$\begin{aligned} \begin{pmatrix} f_A(\boldsymbol e_1) & f_A(\boldsymbol e_2) & \cdots & f_A(\boldsymbol e_n) \end{pmatrix} &= \begin{pmatrix} A \boldsymbol e_1 & A \boldsymbol e_2 & \cdots & A \boldsymbol e_n \end{pmatrix} \\ &= \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end{pmatrix} \begin{pmatrix} A \boldsymbol e_1 & A \boldsymbol e_2 & \cdots & A \boldsymbol e_n \end{pmatrix} \\ &= \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end{pmatrix} A \end{aligned}$

因此， $A$ 本身即为 $f_A$ 在标准基底下的矩阵表示

矩阵表示方便的一点是

可以直接用矩阵积来计算线性映射的复合
可以直接用逆矩阵来计算线性映射的逆映射

命题
令线性映射 $f: U \to V, g: V \to W$ ，分别取基底 $\mathscr A, \mathscr B, \mathscr C$ ，则
设 $f$ 在基底 $\mathscr A, \mathscr B$ 下的矩阵表示为 $T_f$ ， $g$ 在基底 $\mathscr B, \mathscr C$ 下的矩阵表示为 $T_g$ ，则复合映射 $g \circ f: U \to W$ 在基底 $\mathscr A, \mathscr C$ 下的矩阵表示为 $T_{g \circ f} = T_g T_f$

证明

令基

$\begin{aligned} \mathscr A &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \\ \mathscr B &= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_p \end{pmatrix} \\ \mathscr C &= \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} \end{aligned}$

从矩阵表示的定义出发得到

$\begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_p \end{pmatrix} T_f$

两边同时经由 $g$ 映射，得到

$\begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix} = \begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix} T_f$

又因为根据 $g$ 的矩阵表示，有

$\begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix} = \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g$

将其代入上式，得到

$\begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix} = \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g T_f$

根据矩阵表示的定义， $g \circ f$ 在基底 $\mathscr A, \mathscr C$ 下的矩阵表示即为 $T_{g \circ f} = T_g T_f$
$\square$

命题
令线性映射 $f: V \to W$ ，分别取基底 $\mathscr A, \mathscr B$
若 $f$ 是可逆的，那么 $f^{-1}: W \to V$ 在基底 $\mathscr B, \mathscr A$ 下的矩阵表示为 T_{f^{-1}} = T_f^

证明

因为逆映射的定义得到

$f \circ f^{-1} = \mathrm{id}_W, \quad f^{-1} \circ f = \mathrm{id}_V$

所以应用复合映射的结论，得到

$T_f T_{f^{-1}} = E_m, \quad T_{f^{-1}} T_f = E_n$

因此 $T_{f^{-1}} = T_f^{-1}$
$\square$

注意可逆等价于双射，此时同构给出 $\dim V = \dim W$

现在，让我们来讨论一下元素在经由线性映射后，坐标会发生什么样的变化

命题
取线性空间 $V, W$ 的基底 $\mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix}, \quad \mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix}$ ，线性映射 $f: V \to W$ 在基底 $\mathscr A, \mathscr B$ 下的矩阵表示为 $T$
对于 $\boldsymbol v \in V$ ，有

$[f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}$

证明

由坐标的定义

$\boldsymbol v = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} [\boldsymbol v]_{\mathscr A}$

将等式两边通过线性映射 $f$ 映射，可以得到（注意坐标里面的值是常数，提出来）

$f(\boldsymbol v) = \begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix} [\boldsymbol v]_{\mathscr A} = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} T \cdot [\boldsymbol v]_{\mathscr A}$

同时， $f(\boldsymbol v)$ 在基底 $\mathscr B$ 下的坐标定义为

$f(\boldsymbol v) = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} [f(\boldsymbol v)]_{\mathscr B}$

即得

$[f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}$

$\square$

注意由 $\mathscr A$ 到 $\mathscr B$ 的映射是右乘 $T$
但是由 $\mathscr A$ 到 $\mathscr B$ 的坐标变换是左乘 $T$

# 基底变换

令 $V$ 为线性空间，取两组基底

$\mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \quad$
$\mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} \quad$

由于各自都是各自的基底，所以可以用 $\mathscr A$ 来表示 $\mathscr B$ ，即

$\boldsymbol b_j = k_{1j} \boldsymbol a_1 + k_{2j} \boldsymbol a_2 + \cdots + k_{nj} \boldsymbol a_n, \quad j = 1, 2, \ldots, n$

将上述等式整理为矩阵形式

$\begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n1} & k_{n2} & \cdots & k_{nn} \end{pmatrix}$

从线性映射的角度来说，这无非是一个矩阵表示，令

$P = \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1n} \\ k_{21} & k_{22} & \cdots & k_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k_{n1} & k_{n2} & \cdots & k_{nn} \end{pmatrix}$

那么由 $P$ 诱导出的线性映射 $f_P: V \to V$ 成为一个线性变换，特别称为 基底变换 (Change of Basis)「基底変換」
将该基底变换的矩阵表示 $P$ 称为从基底 $\mathscr A$ 到基底 $\mathscr B$ 的 过渡矩阵 (Transition Matrix)「変換行列」
由于二者都是基底，可以互相表示，所以逆变换一定存在，并且其矩阵表示也可以由 $P^{-1}$ 给出

对于任意给出的向量 $\boldsymbol v \in V$ ，两种基下的坐标可以写为

$\boldsymbol v = \mathscr A [\boldsymbol v]_{\mathscr A} = \mathscr B [\boldsymbol v]_{\mathscr B}$

将 $\mathscr B = \mathscr A P$ 代入上式，得到

$\boldsymbol v = \mathscr A P [\boldsymbol v]_{\mathscr B}$

所以

$[\boldsymbol v]_{\mathscr A} = P [\boldsymbol v]_{\mathscr B}$

基底变换中的结构是新基底 = 旧基底 × 过渡矩阵
坐标变换中的结构是旧坐标 = 过渡矩阵 × 新坐标，这个方向一定要注意

请注意：给出线性映射 $f: V \to W$ 在基底 $\mathscr A, \mathscr B$ 下的矩阵表示 $T$ ，那么实际上 $T$ 等价于从 $W(\mathscr B)$ 到 $V(\mathscr A)$ 的，由 $T$ 诱导的线性变换，即

$V \xrightarrow{f} W \implies V(\mathscr A) \xleftarrow{T} W(\mathscr B)$

示例
取 $\mathbb R^3$ 的子空间的两组基底

$\begin{aligned} \mathscr A &= \left\{ \boldsymbol a_1 = \begin{pmatrix} 0 \\ 4 \\ -1 \end{pmatrix}, \boldsymbol a_2 = \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix}, \right\}, \\ \mathscr B &= \left\{ \boldsymbol b_1 = \begin{pmatrix} 4 \\ -2 \\ 3 \end{pmatrix}, \boldsymbol b_2 = \begin{pmatrix} 6 \\ -1 \\ 4 \end{pmatrix}, \right\} \end{aligned}$

求从基底 $\mathscr A$ 到基底 $\mathscr B$ 的过渡矩阵

解

求过渡矩阵，等价于求出 $\mathscr B$ 中的基底在 $\mathscr A$ 下的表示，这等价于解线性方程组

$\begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix} \boldsymbol x = \boldsymbol b_j, \quad j = 1, 2$

构造增广矩阵

$\widetilde P := [ \begin{array}{cc|c|c} \boldsymbol a_1 & \boldsymbol a_2 & \boldsymbol b_1 & \boldsymbol b_2 \end{array} ] = \begin{pmatrix} 0 & 2 & 4 & 6 \\ 4 & 1 & -2 & -1 \\ -1 & 1 & 3 & 4 \end{pmatrix}$

行化简后得到

$\xrightarrow{Rref} \begin{pmatrix} 1 & 0 & -1 & -1 \\ 0 & 1 & 2 & 3 \\ 0 & 0 & 0 & 0 \end{pmatrix}$

因此解得

$\begin{cases} \boldsymbol b_1 = -1 \boldsymbol a_1 + 2 \boldsymbol a_2 \\ \boldsymbol b_2 = -1 \boldsymbol a_1 + 3 \boldsymbol a_2 \end{cases}$

这等价于（一定要注意转置）

$\begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 \end{pmatrix} = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix} \begin{pmatrix} -1 & -1 \\ 2 & 3 \end{pmatrix}$

所以从基底 $\mathscr A$ 到基底 $\mathscr B$ 的过渡矩阵为

$P = \begin{pmatrix} -1 & -1 \\ 2 & 3 \end{pmatrix}$

$\square$

现在让我们分析一个稍微复杂一些的情况
在 $V$ 中分别取两组基底

$\mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\} \quad$
$\mathscr A' = \{\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n'\} \quad$

在 $W$ 中分别取两组基底

$\mathscr B = \{\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m\} \quad$
$\mathscr B' = \{\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m'\} \quad$

分别令

$P$ 为从基底 $\mathscr A$ 到基底 $\mathscr A'$ 的过渡矩阵
$Q$ 为从基底 $\mathscr B$ 到基底 $\mathscr B'$ 的过渡矩阵

取线性映射 $T: V \to W$ ，并且令矩阵 $T$ 为其在基底 $\mathscr A, \mathscr B$ 下的矩阵表示
请参考如下示意图

$\begin{array}{ccc} V(\mathscr A) & \xleftarrow{T} & W(\mathscr B) \\ \downarrow P & & \downarrow Q \\ V(\mathscr A') & \xleftarrow{?} & W(\mathscr B') \end{array}$

问题： $?$ 处应当填入什么矩阵，才能使得图式成立？

假设 $X$ 为 $?$ 处的矩阵（也就是在基底 $\mathscr A'$ 和 $\mathscr B'$ 下的矩阵表示），那么根据定义，以下等式应当成立

$(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') X$

整理以下已经有的关系式

$\begin{aligned} (\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') &= (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) P \\ (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) Q \\ (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T \end{aligned}$

由于将线性映射同时作用于线性变换的两边，可以得到

$(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P$

注意关系式 $(AB)^{-1} = B^{-1} A^{-1}$ ，统合上述所有结果

$\begin{aligned} (T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) &= (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P \\ &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T P \\ &= (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') Q^{-1} T P \end{aligned}$

因此可以得到

$X = Q^{-1} T P$

命题
令线性变换 $f: V \to W$
$V$ 中取两组基底 $\mathscr A, \mathscr A'$ ， $W$ 中取两组基底 $\mathscr B, \mathscr B'$
分别令 $P$ 为从基底 $\mathscr A$ 到基底 $\mathscr A'$ 的过渡矩阵， $Q$ 为从基底 $\mathscr B$ 到基底 $\mathscr B'$ 的过渡矩阵
若令 $f$ 在基底 $\mathscr A, \mathscr B$ 下的矩阵表示为 $T$
那么 $f$ 在基底 $\mathscr A', \mathscr B'$ 下的矩阵表示为

$T' = Q^{-1} T P$

证明

见上
$\square$

# 矩阵表示

# 基底变换

【集合论】2-映射

【线性代数】8-线性映射