本章节学习一类特殊的映射:线性映射
由于线性代数这门学科主要分析线性空间下的性质,所以可以非常良好地讨论线性映射

# 线性映射

定义
V,WV, W 分别为域 KK 上的线性空间
若映射 f:VWf: V \to W 满足

  • u,vV,f(u+v)=f(u)+f(v){}^\forall \boldsymbol u, \boldsymbol v \in V, \quad f(\boldsymbol u + \boldsymbol v) = f(\boldsymbol u) + f(\boldsymbol v)
  • vV,kK,f(kv)=kf(v){}^\forall \boldsymbol v \in V, {}^\forall k \in K, \quad f(k \boldsymbol v) = k f(\boldsymbol v)

则称 ff 为从 VVWW线性映射 (Linear Map)「線形写像」

特别地,称 VVVV 的线性映射为 线性变换

由于 V,WV, W 均为线性空间,为了区分不同空间中不同的元,记二者的零元分别为 0V,0W\boldsymbol 0_V, \boldsymbol 0_W
线性映射最基本的性质保证了:构成整个线性空间的核心(零元)是相连的

f(0V)=f(0v)=0f(v)=0Wf(\boldsymbol 0_V) = f(0 \cdot \boldsymbol v) = 0 \cdot f(\boldsymbol v) = \boldsymbol 0_W

定义
称线性映射 f:VWf: V \to W核 (Kernel)「核」

Kerf={vVf(v)=0W}\mathrm{Ker} f = \{\boldsymbol v \in V \mid f(\boldsymbol v) = \boldsymbol 0_W\}

像 (Image)「像」

Imf={f(v)vV}\operatorname{Im} f = \{f(\boldsymbol v) \mid \boldsymbol v \in V\}

# 矩阵表示

V,WV, W 分别为域 KK 上的线性空间,且 dimV=n,dimW=m\dim V = n, \dim W = m
线性映射 T:VWT: V \to W
对于这两个线性空间,分别取基底

  • A={v1,v2,,vn}\mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\}VV 的一组基底
  • B={w1,w2,,wm}\mathscr B = \{\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m\}WW 的一组基底

显然,对于 VV 中的基底 vj\boldsymbol v_j,线性映射会使它成为 WW 中的元。那么就可以写作 WW 中基底的线性组合形式

T(vj)=a1jw1+a2jw2++amjwm,j=1,2,,nT(\boldsymbol v_j) = a_{1j} \boldsymbol w_1 + a_{2j} \boldsymbol w_2 + \cdots + a_{mj} \boldsymbol w_m, \quad j = 1, 2, \ldots, n

逐一计算所有 VV 中基底 A\mathscr A 的映射结果,可以得到如下关系

{T(v1)=a11w1+a21w2++am1wmT(v2)=a12w1+a22w2++am2wmT(vn)=a1nw1+a2nw2++amnwm\begin{cases} T(\boldsymbol v_1) = a_{11} \boldsymbol w_1 + a_{21} \boldsymbol w_2 + \cdots + a_{m1} \boldsymbol w_m \\ T(\boldsymbol v_2) = a_{12} \boldsymbol w_1 + a_{22} \boldsymbol w_2 + \cdots + a_{m2} \boldsymbol w_m \\ \quad \vdots \\ T(\boldsymbol v_n) = a_{1n} \boldsymbol w_1 + a_{2n} \boldsymbol w_2 + \cdots + a_{mn} \boldsymbol w_m \end{cases}

将上述等式整理为矩阵形式

(T(v1)T(v2)T(vn))1×n=(a11a21am1a12a22am2a1na2namn)n×m(w1w2wm)m×1\begin{pmatrix} T(\boldsymbol v_1) \\ T(\boldsymbol v_2) \\ \vdots \\ T(\boldsymbol v_n) \end{pmatrix}_{1 \times n} = \begin{pmatrix} a_{11} & a_{21} & \cdots & a_{m1} \\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \end{pmatrix}_{n \times m} \begin{pmatrix} \boldsymbol w_1 \\ \boldsymbol w_2 \\ \vdots \\ \boldsymbol w_m \end{pmatrix}_{m \times 1}

对两边取转置,得到

(T(v1),T(v2),,T(vn))=(w1,w2,,wm)(a11a12a1na21a22a2nam1am2amn)(T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) = (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}

其中 aija_{ij} 指示了经由 TT 映射后,VV 中第 jj 个基底在 WW 中第 ii 个基底方向上的分量

称此处出现的矩阵

T=(a11a12a1na21a22a2nam1am2amn)T = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}

为线性映射 TT 在基底 A,B\mathscr A, \mathscr B 下的 矩阵表示

对于线性映射,直接将映射符号作为其矩阵表示的写法是一种惯例,用于方便地看出线性映射本质上是如何通过矩阵乘法来使得空间变形的
但是使用的过程中需要自己明确:何时应为矩阵表示,何时应为线性映射

线性映射的矩阵表示如同线性映射的身份信息。因为矩阵表示 完整描述 了所有与基底有关的变化情况。而任意的向量都可以被基底线性表示出来。
这就意味着:矩阵 TT 实际上决定了 所有 元的映射规则

示例
考虑 R2\mathbb R^2R2\mathbb R^2 的线性映射 RR,基底令为标准基底 E={e1,e2}\mathscr E = \{\boldsymbol e_1, \boldsymbol e_2\},取矩阵表示

R(θ)=(sinθcosθcosθsinθ)R(\theta) = \begin{pmatrix} \sin \theta & -\cos \theta \\ \cos \theta & \sin \theta \end{pmatrix}

此线性映射表示将 R2\mathbb R^2 中的向量绕原点逆时针旋转 θ\theta 角度

现在,让我们来讨论一下元素在经由线性变换后,坐标会发生什么样的变化

符号约定:令 A=(v1,v2,,vn)\mathscr A = (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) 为线性空间 VV 的一组基底,若对于元 vV\boldsymbol v \in V,有

a=k1v1+k2v2++knvn\boldsymbol a = k_1 \boldsymbol v_1 + k_2 \boldsymbol v_2 + \cdots + k_n \boldsymbol v_n

则称向量 a\boldsymbol a 在基底 A\mathscr A 下的 坐标

[a]A=(k1k2kn)[\boldsymbol a]_{\mathscr A} = \begin{pmatrix} k_1 \\ k_2 \\ \vdots \\ k_n \end{pmatrix}

以下命题揭示了线性变换对于坐标的改变,可以直接由矩阵表现计算得到

命题
取线性空间 V,WV, W 的基底 A=(v1,v2,,vn),B=(w1,w2,,wm)\mathscr A = (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n), \quad \mathscr B = (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m),线性映射 T:VWT: V \to W 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示为 TT
对于 vV\boldsymbol v \in V,有

[T(v)]B=T[v]A[T(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}

证明

由坐标的定义

v=(v1,v2,,vn)[v]A\boldsymbol v = (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n)[\boldsymbol v]_{\mathscr A}

将等式两边通过线性映射 TT 映射,可以得到(注意坐标里面的值是常数,提出来)

T(v)=(T(v1),T(v2),,T(vn))[v]A=(w1,w2,,wm)T[v]AT(\boldsymbol v) = (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) [\boldsymbol v]_{\mathscr A} = (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T \cdot [\boldsymbol v]_{\mathscr A}

同时,T(v)T(\boldsymbol v) 在基底 B\mathscr B 下的坐标定义为

T(v)=(w1,w2,,wm)[T(v)]BT(\boldsymbol v) = (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) [T(\boldsymbol v)]_{\mathscr B}

即得

[T(v)]B=T[v]A[T(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}

\square

注意方向:

  • 基底变换中的结构是 新基底 = 旧基底 × 过渡矩阵
  • 坐标变换中的结构是 新坐标 = 过渡矩阵 × 旧坐标

取线性表换 P:VVP: V \to V
从空间 VV 中,取两组不同的基底 A={v1,v2,,vn}\mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\}A={v1,v2,,vn}\mathscr A' = \{\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n'\} \quad

显然,因为线性变换也属于线性映射,所以可以写出它的矩阵表示

(v1,v2,,vn)=(v1,v2,,vn)P(\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') = (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) P

其中 PP 是一个 nn 阶方阵
非常容易验证:PP 是可逆的。所以也存在逆变换

(v1,v2,,vn)=(v1,v2,,vn)P1(\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) = (\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') P^{-1}

特别地,称 PP 为从基底 A\mathscr A 到基底 A\mathscr A'过渡矩阵
(一般称为矩阵表示)

应用坐标变换的结论,同样有

[v]A=P[v]A[\boldsymbol v]_{\mathscr A'} = P [\boldsymbol v]_{\mathscr A}

请注意:给出线性映射 f:VWf: V \to W 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示 TT,那么实际上 TT 等价于从 W(B)W(\mathscr B)V(A)V(\mathscr A) 的变换,即

VfWV(A)TW(B)V \xrightarrow{f} W \implies V(\mathscr A) \xleftarrow{T} W(\mathscr B)

# 不同基底下的矩阵表示

现在让我们分析一个稍微复杂一些的情况
VV 中分别取两组基底

  • A={v1,v2,,vn}\mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\} \quad
  • A={v1,v2,,vn}\mathscr A' = \{\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n'\} \quad

WW 中分别取两组基底

  • B={w1,w2,,wm}\mathscr B = \{\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m\} \quad
  • B={w1,w2,,wm}\mathscr B' = \{\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m'\} \quad

分别令

  • PP 为从基底 A\mathscr A 到基底 A\mathscr A' 的过渡矩阵
  • QQ 为从基底 B\mathscr B 到基底 B\mathscr B' 的过渡矩阵

取线性映射 T:VWT: V \to W,并且令矩阵 TT 为其在基底 A,B\mathscr A, \mathscr B 下的矩阵表示
请参考如下示意图

V(A)TW(B)PQV(A)?W(B)\begin{array}{ccc} V(\mathscr A) & \xleftarrow{T} & W(\mathscr B) \\ \downarrow P & & \downarrow Q \\ V(\mathscr A') & \xleftarrow{?} & W(\mathscr B') \end{array}

问题:?? 处应当填入什么矩阵,才能使得图式成立?

假设 XX?? 处的矩阵(也就是在基底 A\mathscr A'B\mathscr B' 下的矩阵表示),那么根据定义,以下等式应当成立

(T(v1),T(v2),,T(vn))=(w1,w2,,wm)X(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') X

整理以下已经有的关系式

(v1,v2,,vn)=(v1,v2,,vn)P(w1,w2,,wm)=(w1,w2,,wm)Q(T(v1),T(v2),,T(vn))=(w1,w2,,wm)T\begin{aligned} (\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') &= (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) P \\ (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) Q \\ (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T \end{aligned}

由于将线性映射同时作用于线性变换的两边,可以得到

(T(v1),T(v2),,T(vn))=(T(v1),T(v2),,T(vn))P(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) = (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P

注意关系式 (AB)1=B1A1(AB)^{-1} = B^{-1} A^{-1},统合上述所有结果

(T(v1),T(v2),,T(vn))=(T(v1),T(v2),,T(vn))P=(w1,w2,,wm)TP=(w1,w2,,wm)Q1TP\begin{aligned} (T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n')) &= (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P \\ &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T P \\ &= (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') Q^{-1} T P \end{aligned}

因此可以得到

X=Q1TPX = Q^{-1} T P

命题
令线性变换 T:VVT: V \to V
VV 中取两组基底 A,A\mathscr A, \mathscr A'WW 中取两组基底 B,B\mathscr B, \mathscr B'
分别令 PP 为从基底 A\mathscr A 到基底 A\mathscr A' 的过渡矩阵,QQ 为从基底 B\mathscr B 到基底 B\mathscr B' 的过渡矩阵
若令 TT 在基底 A,B\mathscr A, \mathscr B 下的矩阵表示
那么 TT 在基底 A,B\mathscr A', \mathscr B' 下的矩阵表示为

T=Q1TPT' = Q^{-1} T P

证明

见上
\square