# 矩阵表示
让我们从一类线性映射出发
给定 m × n m \times n m × n 矩阵 A A A ,定义映射
f A : R n → R m , f A ( x ) = A x f_A: \mathbb R^n \to \mathbb R^m, \quad f_A(\boldsymbol x) = A \boldsymbol x
f A : R n → R m , f A ( x ) = A x
则容易验证 f A f_A f A 为线性映射
称这一类线性映射为由矩阵诱导的线性映射
也非常容易验证的是,f A f_A f A 的核实际上就是齐次方程 A x = 0 A \boldsymbol x = \boldsymbol 0 A x = 0 的解空间,而像则是 A A A 的列向量的线性结合,也就是说
K e r f A = N ( A ) , dim ( K e r f A ) = n − r a n k ( A ) \mathrm{Ker} f_A = N(A),\quad \dim(\mathrm{Ker} f_A) = n - \mathrm{rank}(A) K e r f A = N ( A ) , dim ( K e r f A ) = n − r a n k ( A )
I m f A = C ( A ) , dim ( I m f A ) = r a n k ( A ) \mathrm{Im} f_A = C(A),\quad \dim(\mathrm{Im} f_A) = \mathrm{rank}(A) I m f A = C ( A ) , dim ( I m f A ) = r a n k ( A )
那么代入到单射与满射的判定,可以得到
f A f_A f A 为单射 ⟺ r ( A ) = n \iff r(A) = n ⟺ r ( A ) = n
f A f_A f A 为满射 ⟺ r ( A ) = m \iff r(A) = m ⟺ r ( A ) = m
若 A A A 为方阵,则 单射 ⟺ \iff ⟺ 满射 ⟺ \iff ⟺ 同构 ⟺ \iff ⟺ A A A 可逆
也就是说,通过分析矩阵 A A A ,是完全可以等价于分析 f A f_A f A 的性质的
实际上矩阵这一数学对象与线性映射之间的交互远远不止于此,自然产生的期望是:任意线性映射是否都可以用矩阵来分析?
令 V , W V, W V , W 分别为域 F \mathbb F F 上的线性空间,且 dim V = n , dim W = m \dim V = n, \dim W = m dim V = n , dim W = m
线性映射 f : V → W f: V \to W f : V → W
对于这两个线性空间,分别取
A = ( a 1 a 2 ⋯ a n ) \mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} A = ( a 1 a 2 ⋯ a n ) 为 V V V 的一组基
B = ( b 1 b 2 ⋯ b m ) \mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} B = ( b 1 b 2 ⋯ b m ) 为 W W W 的一组基
显然,对于 V V V 中的基 a j \boldsymbol a_j a j ,线性映射会使它成为 W W W 中的元。那么就可以写作 W W W 中基底的线性组合形式(注意这里的编号)
f ( a j ) = k 1 j b 1 + k 2 j b 2 + ⋯ + k m j b m , j = 1 , 2 , … , n f(\boldsymbol a_j) = k_{1j} \boldsymbol b_1 + k_{2j} \boldsymbol b_2 + \cdots + k_{mj} \boldsymbol b_m, \quad j = 1, 2, \ldots, n
f ( a j ) = k 1 j b 1 + k 2 j b 2 + ⋯ + k m j b m , j = 1 , 2 , … , n
逐一计算所有 V V V 中基底 A \mathscr A A 的映射结果,可以得到如下关系
{ f ( a 1 ) = k 11 b 1 + k 21 b 2 + ⋯ + k m 1 b m f ( a 2 ) = k 12 b 1 + k 22 b 2 + ⋯ + k m 2 b m ⋮ f ( a n ) = k 1 n b 1 + k 2 n b 2 + ⋯ + k m n b m \begin{cases}
f(\boldsymbol a_1) = k_{11} \boldsymbol b_1 + k_{21} \boldsymbol b_2 + \cdots + k_{m1} \boldsymbol b_m \\
f(\boldsymbol a_2) = k_{12} \boldsymbol b_1 + k_{22} \boldsymbol b_2 + \cdots + k_{m2} \boldsymbol b_m \\
\quad \vdots \\
f(\boldsymbol a_n) = k_{1n} \boldsymbol b_1 + k_{2n} \boldsymbol b_2 + \cdots + k_{mn} \boldsymbol b_m
\end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ f ( a 1 ) = k 1 1 b 1 + k 2 1 b 2 + ⋯ + k m 1 b m f ( a 2 ) = k 1 2 b 1 + k 2 2 b 2 + ⋯ + k m 2 b m ⋮ f ( a n ) = k 1 n b 1 + k 2 n b 2 + ⋯ + k m n b m
将上述等式整理为矩阵形式
( f ( a 1 ) f ( a 2 ) ⋮ f ( a n ) ) 1 × n = ( k 11 k 21 ⋯ k m 1 k 12 k 22 ⋯ k m 2 ⋮ ⋮ ⋱ ⋮ k 1 n k 2 n ⋯ k m n ) n × m ( b 1 b 2 ⋮ b m ) m × 1 \begin{pmatrix}
f(\boldsymbol a_1) \\
f(\boldsymbol a_2) \\
\vdots \\
f(\boldsymbol a_n)
\end{pmatrix}_{1 \times n}
= \begin{pmatrix}
k_{11} & k_{21} & \cdots & k_{m1} \\
k_{12} & k_{22} & \cdots & k_{m2} \\
\vdots & \vdots & \ddots & \vdots \\
k_{1n} & k_{2n} & \cdots & k_{mn}
\end{pmatrix}_{n \times m}
\begin{pmatrix}
\boldsymbol b_1 \\
\boldsymbol b_2 \\
\vdots \\
\boldsymbol b_m
\end{pmatrix}_{m \times 1} ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ f ( a 1 ) f ( a 2 ) ⋮ f ( a n ) ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ 1 × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k 1 1 k 1 2 ⋮ k 1 n k 2 1 k 2 2 ⋮ k 2 n ⋯ ⋯ ⋱ ⋯ k m 1 k m 2 ⋮ k m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ n × m ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ b 1 b 2 ⋮ b m ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × 1
对两边取转置,得到基的格式
( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) = ( b 1 b 2 ⋯ b m ) ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k m 1 k m 2 ⋯ k m n ) \begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix}
= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix}
\begin{pmatrix}
k_{11} & k_{12} & \cdots & k_{1n} \\
k_{21} & k_{22} & \cdots & k_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
k_{m1} & k_{m2} & \cdots & k_{mn}
\end{pmatrix} ( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) = ( b 1 b 2 ⋯ b m ) ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k 1 1 k 2 1 ⋮ k m 1 k 1 2 k 2 2 ⋮ k m 2 ⋯ ⋯ ⋱ ⋯ k 1 n k 2 n ⋮ k m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
其中 k i j k_{ij} k i j 指示了经由 f f f 映射后,V V V 中第 j j j 个基底在 W W W 中第 i i i 个基底方向上的分量
称此处出现的矩阵
T = ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k m 1 k m 2 ⋯ k m n ) T = \begin{pmatrix}
k_{11} & k_{12} & \cdots & k_{1n} \\
k_{21} & k_{22} & \cdots & k_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
k_{m1} & k_{m2} & \cdots & k_{mn}
\end{pmatrix} T = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k 1 1 k 2 1 ⋮ k m 1 k 1 2 k 2 2 ⋮ k m 2 ⋯ ⋯ ⋱ ⋯ k 1 n k 2 n ⋮ k m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
为线性映射 f f f 在基底 A , B \mathscr A, \mathscr B A , B 下的 矩阵表示 (Matrix Representation)「表現行列」
线性映射的矩阵表示如同线性映射的身份信息。
因为矩阵表示 完整描述 了所有与基底有关的变化情况。而任意的向量都可以被基底线性表示出来。
这就意味着:矩阵 T T T 实际上决定了 所有 元的映射规则
不难看出,矩阵表示依赖于两个线性空间的基的选择,不同的基底会导致不同的矩阵表示
一般的,由 F n \mathbb F^n F n 到 F m \mathbb F^m F m 的线性映射 f f f 在标准基底下的矩阵表示,称为 标准矩阵表示
示例
考虑 R 2 \mathbb R^2 R 2 到 R 2 \mathbb R^2 R 2 的线性变换 R R R ,基底令为标准基 E = ( e 1 e 2 ) \mathscr E = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} E = ( e 1 e 2 ) ,取矩阵表示
R ( θ ) = ( sin θ − cos θ cos θ sin θ ) R(\theta) = \begin{pmatrix}
\sin \theta & -\cos \theta \\
\cos \theta & \sin \theta
\end{pmatrix} R ( θ ) = ( sin θ cos θ − cos θ sin θ )
此线性变换表示将 R 2 \mathbb R^2 R 2 中的向量绕原点逆时针旋转 θ \theta θ 角度
一般地,对于由 A A A 诱导出的线性映射 f A : V → W f_A: V \to W f A : V → W
取 V V V 的标准基底 \mathscr E = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 & \cdots & \boldsymbol e_n \end
取 W W W 的标准基底 \mathscr E' = \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end
则
( f A ( e 1 ) f A ( e 2 ) ⋯ f A ( e n ) ) = ( A e 1 A e 2 ⋯ A e n ) = ( e 1 ′ e 2 ′ ⋯ e m ′ ) ( A e 1 A e 2 ⋯ A e n ) = ( e 1 ′ e 2 ′ ⋯ e m ′ ) A \begin{aligned}
\begin{pmatrix} f_A(\boldsymbol e_1) & f_A(\boldsymbol e_2) & \cdots & f_A(\boldsymbol e_n) \end{pmatrix}
&= \begin{pmatrix} A \boldsymbol e_1 & A \boldsymbol e_2 & \cdots & A \boldsymbol e_n \end{pmatrix} \\
&= \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end{pmatrix}
\begin{pmatrix} A \boldsymbol e_1 & A \boldsymbol e_2 & \cdots & A \boldsymbol e_n \end{pmatrix} \\
&= \begin{pmatrix} \boldsymbol e_1' & \boldsymbol e_2' & \cdots & \boldsymbol e_m' \end{pmatrix} A
\end{aligned} ( f A ( e 1 ) f A ( e 2 ) ⋯ f A ( e n ) ) = ( A e 1 A e 2 ⋯ A e n ) = ( e 1 ′ e 2 ′ ⋯ e m ′ ) ( A e 1 A e 2 ⋯ A e n ) = ( e 1 ′ e 2 ′ ⋯ e m ′ ) A
因此,A A A 本身即为 f A f_A f A 在标准基底下的矩阵表示
矩阵表示方便的一点是
可以直接用矩阵积来计算线性映射的复合
可以直接用逆矩阵来计算线性映射的逆映射
命题
令线性映射 f : U → V , g : V → W f: U \to V, g: V \to W f : U → V , g : V → W ,分别取基底 A , B , C \mathscr A, \mathscr B, \mathscr C A , B , C ,则
设 f f f 在基底 A , B \mathscr A, \mathscr B A , B 下的矩阵表示为 T f T_f T f ,g g g 在基底 B , C \mathscr B, \mathscr C B , C 下的矩阵表示为 T g T_g T g ,则复合映射 g ∘ f : U → W g \circ f: U \to W g ∘ f : U → W 在基底 A , C \mathscr A, \mathscr C A , C 下的矩阵表示为 T g ∘ f = T g T f T_{g \circ f} = T_g T_f T g ∘ f = T g T f
证明
令基
A = ( a 1 a 2 ⋯ a n ) B = ( b 1 b 2 ⋯ b p ) C = ( c 1 c 2 ⋯ c m ) \begin{aligned}
\mathscr A &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \\
\mathscr B &= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_p \end{pmatrix} \\
\mathscr C &= \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix}
\end{aligned} A B C = ( a 1 a 2 ⋯ a n ) = ( b 1 b 2 ⋯ b p ) = ( c 1 c 2 ⋯ c m )
从矩阵表示的定义出发得到
( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) = ( b 1 b 2 ⋯ b p ) T f \begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix}
= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_p \end{pmatrix} T_f ( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) = ( b 1 b 2 ⋯ b p ) T f
两边同时经由 g g g 映射,得到
( g ( f ( a 1 ) ) g ( f ( a 2 ) ) ⋯ g ( f ( a n ) ) ) = ( g ( b 1 ) g ( b 2 ) ⋯ g ( b p ) ) T f \begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix}
= \begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix} T_f ( g ( f ( a 1 ) ) g ( f ( a 2 ) ) ⋯ g ( f ( a n ) ) ) = ( g ( b 1 ) g ( b 2 ) ⋯ g ( b p ) ) T f
又因为根据 g g g 的矩阵表示,有
( g ( b 1 ) g ( b 2 ) ⋯ g ( b p ) ) = ( c 1 c 2 ⋯ c m ) T g \begin{pmatrix} g(\boldsymbol b_1) & g(\boldsymbol b_2) & \cdots & g(\boldsymbol b_p) \end{pmatrix}
= \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g ( g ( b 1 ) g ( b 2 ) ⋯ g ( b p ) ) = ( c 1 c 2 ⋯ c m ) T g
将其代入上式,得到
( g ( f ( a 1 ) ) g ( f ( a 2 ) ) ⋯ g ( f ( a n ) ) ) = ( c 1 c 2 ⋯ c m ) T g T f \begin{pmatrix} g(f(\boldsymbol a_1)) & g(f(\boldsymbol a_2)) & \cdots & g(f(\boldsymbol a_n)) \end{pmatrix}
= \begin{pmatrix} \boldsymbol c_1 & \boldsymbol c_2 & \cdots & \boldsymbol c_m \end{pmatrix} T_g T_f ( g ( f ( a 1 ) ) g ( f ( a 2 ) ) ⋯ g ( f ( a n ) ) ) = ( c 1 c 2 ⋯ c m ) T g T f
根据矩阵表示的定义,g ∘ f g \circ f g ∘ f 在基底 A , C \mathscr A, \mathscr C A , C 下的矩阵表示即为 T g ∘ f = T g T f T_{g \circ f} = T_g T_f T g ∘ f = T g T f
□ \square □
命题
令线性映射 f : V → W f: V \to W f : V → W ,分别取基底 A , B \mathscr A, \mathscr B A , B
若 f f f 是可逆的,那么 f − 1 : W → V f^{-1}: W \to V f − 1 : W → V 在基底 B , A \mathscr B, \mathscr A B , A 下的矩阵表示为 T_{f^{-1}} = T_f^
证明
因为逆映射的定义得到
f ∘ f − 1 = i d W , f − 1 ∘ f = i d V f \circ f^{-1} = \mathrm{id}_W, \quad f^{-1} \circ f = \mathrm{id}_V
f ∘ f − 1 = i d W , f − 1 ∘ f = i d V
所以应用复合映射的结论,得到
T f T f − 1 = E m , T f − 1 T f = E n T_f T_{f^{-1}} = E_m, \quad T_{f^{-1}} T_f = E_n
T f T f − 1 = E m , T f − 1 T f = E n
因此 T f − 1 = T f − 1 T_{f^{-1}} = T_f^{-1} T f − 1 = T f − 1
□ \square □
注意可逆等价于双射,此时同构给出 dim V = dim W \dim V = \dim W dim V = dim W
现在,让我们来讨论一下元素在经由线性映射后,坐标会发生什么样的变化
命题
取线性空间 V , W V, W V , W 的基底 A = ( a 1 a 2 ⋯ a n ) , B = ( b 1 b 2 ⋯ b m ) \mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix}, \quad \mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} A = ( a 1 a 2 ⋯ a n ) , B = ( b 1 b 2 ⋯ b m ) ,线性映射 f : V → W f: V \to W f : V → W 在基底 A , B \mathscr A, \mathscr B A , B 下的矩阵表示为 T T T
对于 v ∈ V \boldsymbol v \in V v ∈ V ,有
[ f ( v ) ] B = T [ v ] A [f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}
[ f ( v ) ] B = T [ v ] A
证明
由坐标的定义
v = ( a 1 a 2 ⋯ a n ) [ v ] A \boldsymbol v = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} [\boldsymbol v]_{\mathscr A}
v = ( a 1 a 2 ⋯ a n ) [ v ] A
将等式两边通过线性映射 f f f 映射,可以得到(注意坐标里面的值是常数,提出来)
f ( v ) = ( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) [ v ] A = ( b 1 b 2 ⋯ b m ) T ⋅ [ v ] A f(\boldsymbol v) = \begin{pmatrix} f(\boldsymbol a_1) & f(\boldsymbol a_2) & \cdots & f(\boldsymbol a_n) \end{pmatrix} [\boldsymbol v]_{\mathscr A}
= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} T \cdot [\boldsymbol v]_{\mathscr A} f ( v ) = ( f ( a 1 ) f ( a 2 ) ⋯ f ( a n ) ) [ v ] A = ( b 1 b 2 ⋯ b m ) T ⋅ [ v ] A
同时,f ( v ) f(\boldsymbol v) f ( v ) 在基底 B \mathscr B B 下的坐标定义为
f ( v ) = ( b 1 b 2 ⋯ b m ) [ f ( v ) ] B f(\boldsymbol v) = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_m \end{pmatrix} [f(\boldsymbol v)]_{\mathscr B}
f ( v ) = ( b 1 b 2 ⋯ b m ) [ f ( v ) ] B
即得
[ f ( v ) ] B = T [ v ] A [f(\boldsymbol v)]_{\mathscr B} = T [\boldsymbol v]_{\mathscr A}
[ f ( v ) ] B = T [ v ] A
□ \square □
注意由 A \mathscr A A 到 B \mathscr B B 的映射是右乘 T T T
但是由 A \mathscr A A 到 B \mathscr B B 的坐标变换是左乘 T T T
# 基底变换
令 V V V 为线性空间,取两组基底
A = ( a 1 a 2 ⋯ a n ) \mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \quad A = ( a 1 a 2 ⋯ a n )
B = ( b 1 b 2 ⋯ b n ) \mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} \quad B = ( b 1 b 2 ⋯ b n )
由于各自都是各自的基底,所以可以用 A \mathscr A A 来表示 B \mathscr B B ,即
b j = k 1 j a 1 + k 2 j a 2 + ⋯ + k n j a n , j = 1 , 2 , … , n \boldsymbol b_j = k_{1j} \boldsymbol a_1 + k_{2j} \boldsymbol a_2 + \cdots + k_{nj} \boldsymbol a_n, \quad j = 1, 2, \ldots, n
b j = k 1 j a 1 + k 2 j a 2 + ⋯ + k n j a n , j = 1 , 2 , … , n
将上述等式整理为矩阵形式
( b 1 b 2 ⋯ b n ) = ( a 1 a 2 ⋯ a n ) ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k n 1 k n 2 ⋯ k n n ) \begin{pmatrix}
\boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n
\end{pmatrix}
= \begin{pmatrix}
\boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n
\end{pmatrix}
\begin{pmatrix}
k_{11} & k_{12} & \cdots & k_{1n} \\
k_{21} & k_{22} & \cdots & k_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
k_{n1} & k_{n2} & \cdots & k_{nn}
\end{pmatrix} ( b 1 b 2 ⋯ b n ) = ( a 1 a 2 ⋯ a n ) ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k 1 1 k 2 1 ⋮ k n 1 k 1 2 k 2 2 ⋮ k n 2 ⋯ ⋯ ⋱ ⋯ k 1 n k 2 n ⋮ k n n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
从线性映射的角度来说,这无非是一个矩阵表示,令
P = ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k n 1 k n 2 ⋯ k n n ) P = \begin{pmatrix}
k_{11} & k_{12} & \cdots & k_{1n} \\
k_{21} & k_{22} & \cdots & k_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
k_{n1} & k_{n2} & \cdots & k_{nn}
\end{pmatrix} P = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k 1 1 k 2 1 ⋮ k n 1 k 1 2 k 2 2 ⋮ k n 2 ⋯ ⋯ ⋱ ⋯ k 1 n k 2 n ⋮ k n n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
那么由 P P P 诱导出的线性映射 f P : V → V f_P: V \to V f P : V → V 成为一个线性变换,特别称为 基底变换 (Change of Basis)「基底変換」
将该基底变换的矩阵表示 P P P 称为从基底 A \mathscr A A 到基底 B \mathscr B B 的 过渡矩阵 (Transition Matrix)「変換行列」
由于二者都是基底,可以互相表示,所以逆变换一定存在,并且其矩阵表示也可以由 P − 1 P^{-1} P − 1 给出
对于任意给出的向量 v ∈ V \boldsymbol v \in V v ∈ V ,两种基下的坐标可以写为
v = A [ v ] A = B [ v ] B \boldsymbol v = \mathscr A [\boldsymbol v]_{\mathscr A} = \mathscr B [\boldsymbol v]_{\mathscr B}
v = A [ v ] A = B [ v ] B
将 B = A P \mathscr B = \mathscr A P B = A P 代入上式,得到
v = A P [ v ] B \boldsymbol v = \mathscr A P [\boldsymbol v]_{\mathscr B}
v = A P [ v ] B
所以
[ v ] A = P [ v ] B [\boldsymbol v]_{\mathscr A} = P [\boldsymbol v]_{\mathscr B}
[ v ] A = P [ v ] B
基底变换中的结构是 新基底 = 旧基底 × 过渡矩阵
坐标变换中的结构是 旧坐标 = 过渡矩阵 × 新坐标,这个方向一定要注意
请注意:给出线性映射 f : V → W f: V \to W f : V → W 在基底 A , B \mathscr A, \mathscr B A , B 下的矩阵表示 T T T ,那么实际上 T T T 等价于从 W ( B ) W(\mathscr B) W ( B ) 到 V ( A ) V(\mathscr A) V ( A ) 的,由 T T T 诱导的线性变换,即
V → f W ⟹ V ( A ) ← T W ( B ) V \xrightarrow{f} W \implies V(\mathscr A) \xleftarrow{T} W(\mathscr B)
V f W ⟹ V ( A ) T W ( B )
示例
取 R 3 \mathbb R^3 R 3 的子空间 的两组基底
A = { a 1 = ( 0 4 − 1 ) , a 2 = ( 2 1 1 ) , } , B = { b 1 = ( 4 − 2 3 ) , b 2 = ( 6 − 1 4 ) , } \begin{aligned}
\mathscr A &= \left\{
\boldsymbol a_1 = \begin{pmatrix} 0 \\ 4 \\ -1 \end{pmatrix},
\boldsymbol a_2 = \begin{pmatrix} 2 \\ 1 \\ 1 \end{pmatrix},
\right\}, \\
\mathscr B &= \left\{
\boldsymbol b_1 = \begin{pmatrix} 4 \\ -2 \\ 3 \end{pmatrix},
\boldsymbol b_2 = \begin{pmatrix} 6 \\ -1 \\ 4 \end{pmatrix},
\right\}
\end{aligned} A B = ⎩ ⎪ ⎨ ⎪ ⎧ a 1 = ⎝ ⎛ 0 4 − 1 ⎠ ⎞ , a 2 = ⎝ ⎛ 2 1 1 ⎠ ⎞ , ⎭ ⎪ ⎬ ⎪ ⎫ , = ⎩ ⎪ ⎨ ⎪ ⎧ b 1 = ⎝ ⎛ 4 − 2 3 ⎠ ⎞ , b 2 = ⎝ ⎛ 6 − 1 4 ⎠ ⎞ , ⎭ ⎪ ⎬ ⎪ ⎫
求从基底 A \mathscr A A 到基底 B \mathscr B B 的过渡矩阵
解
求过渡矩阵,等价于求出 B \mathscr B B 中的基底在 A \mathscr A A 下的表示,这等价于解线性方程组
( a 1 a 2 ) x = b j , j = 1 , 2 \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix}
\boldsymbol x = \boldsymbol b_j, \quad j = 1, 2 ( a 1 a 2 ) x = b j , j = 1 , 2
构造增广矩阵
P ~ : = [ a 1 a 2 b 1 b 2 ] = ( 0 2 4 6 4 1 − 2 − 1 − 1 1 3 4 ) \widetilde P := [ \begin{array}{cc|c|c} \boldsymbol a_1 & \boldsymbol a_2 & \boldsymbol b_1 & \boldsymbol b_2 \end{array} ]
= \begin{pmatrix}
0 & 2 & 4 & 6 \\
4 & 1 & -2 & -1 \\
-1 & 1 & 3 & 4
\end{pmatrix} P : = [ a 1 a 2 b 1 b 2 ] = ⎝ ⎛ 0 4 − 1 2 1 1 4 − 2 3 6 − 1 4 ⎠ ⎞
行化简后得到
→ R r e f ( 1 0 − 1 − 1 0 1 2 3 0 0 0 0 ) \xrightarrow{Rref}
\begin{pmatrix}
1 & 0 & -1 & -1 \\
0 & 1 & 2 & 3 \\
0 & 0 & 0 & 0
\end{pmatrix} R r e f ⎝ ⎛ 1 0 0 0 1 0 − 1 2 0 − 1 3 0 ⎠ ⎞
因此解得
{ b 1 = − 1 a 1 + 2 a 2 b 2 = − 1 a 1 + 3 a 2 \begin{cases}
\boldsymbol b_1 = -1 \boldsymbol a_1 + 2 \boldsymbol a_2 \\
\boldsymbol b_2 = -1 \boldsymbol a_1 + 3 \boldsymbol a_2
\end{cases} { b 1 = − 1 a 1 + 2 a 2 b 2 = − 1 a 1 + 3 a 2
这等价于(一定要注意转置)
( b 1 b 2 ) = ( a 1 a 2 ) ( − 1 − 1 2 3 ) \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 \end{pmatrix}
= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 \end{pmatrix}
\begin{pmatrix}
-1 & -1 \\
2 & 3
\end{pmatrix} ( b 1 b 2 ) = ( a 1 a 2 ) ( − 1 2 − 1 3 )
所以从基底 A \mathscr A A 到基底 B \mathscr B B 的过渡矩阵为
P = ( − 1 − 1 2 3 ) P = \begin{pmatrix}
-1 & -1 \\
2 & 3
\end{pmatrix} P = ( − 1 2 − 1 3 )
□ \square □
现在让我们分析一个稍微复杂一些的情况
在 V V V 中分别取两组基底
A = { v 1 , v 2 , … , v n } \mathscr A = \{\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n\} \quad A = { v 1 , v 2 , … , v n }
A ′ = { v 1 ′ , v 2 ′ , … , v n ′ } \mathscr A' = \{\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n'\} \quad A ′ = { v 1 ′ , v 2 ′ , … , v n ′ }
在 W W W 中分别取两组基底
B = { w 1 , w 2 , … , w m } \mathscr B = \{\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m\} \quad B = { w 1 , w 2 , … , w m }
B ′ = { w 1 ′ , w 2 ′ , … , w m ′ } \mathscr B' = \{\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m'\} \quad B ′ = { w 1 ′ , w 2 ′ , … , w m ′ }
分别令
P P P 为从基底 A \mathscr A A 到基底 A ′ \mathscr A' A ′ 的过渡矩阵
Q Q Q 为从基底 B \mathscr B B 到基底 B ′ \mathscr B' B ′ 的过渡矩阵
取线性映射 T : V → W T: V \to W T : V → W ,并且令矩阵 T T T 为其在基底 A , B \mathscr A, \mathscr B A , B 下的矩阵表示
请参考如下示意图
V ( A ) ← T W ( B ) ↓ P ↓ Q V ( A ′ ) ← ? W ( B ′ ) \begin{array}{ccc}
V(\mathscr A) & \xleftarrow{T} & W(\mathscr B) \\
\downarrow P & & \downarrow Q \\
V(\mathscr A') & \xleftarrow{?} & W(\mathscr B')
\end{array} V ( A ) ↓ P V ( A ′ ) T ? W ( B ) ↓ Q W ( B ′ )
问题:? ? ? 处应当填入什么矩阵,才能使得图式成立?
假设 X X X 为 ? ? ? 处的矩阵(也就是在基底 A ′ \mathscr A' A ′ 和 B ′ \mathscr B' B ′ 下的矩阵表示),那么根据定义,以下等式应当成立
( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( w 1 ′ , w 2 ′ , … , w m ′ ) X (T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n'))
= (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') X ( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( w 1 ′ , w 2 ′ , … , w m ′ ) X
整理以下已经有的关系式
( v 1 ′ , v 2 ′ , … , v n ′ ) = ( v 1 , v 2 , … , v n ) P ( w 1 ′ , w 2 ′ , … , w m ′ ) = ( w 1 , w 2 , … , w m ) Q ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) = ( w 1 , w 2 , … , w m ) T \begin{aligned}
(\boldsymbol v_1', \boldsymbol v_2', \ldots, \boldsymbol v_n') &= (\boldsymbol v_1, \boldsymbol v_2, \ldots, \boldsymbol v_n) P \\
(\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) Q \\
(T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) &= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T
\end{aligned} ( v 1 ′ , v 2 ′ , … , v n ′ ) ( w 1 ′ , w 2 ′ , … , w m ′ ) ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) = ( v 1 , v 2 , … , v n ) P = ( w 1 , w 2 , … , w m ) Q = ( w 1 , w 2 , … , w m ) T
由于将线性映射同时作用于线性变换的两边,可以得到
( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) P (T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n'))
= (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P ( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) P
注意关系式 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1} A^{-1} ( A B ) − 1 = B − 1 A − 1 ,统合上述所有结果
( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) P = ( w 1 , w 2 , … , w m ) T P = ( w 1 ′ , w 2 ′ , … , w m ′ ) Q − 1 T P \begin{aligned}
(T(\boldsymbol v_1'), T(\boldsymbol v_2'), \ldots, T(\boldsymbol v_n'))
&= (T(\boldsymbol v_1), T(\boldsymbol v_2), \ldots, T(\boldsymbol v_n)) P \\
&= (\boldsymbol w_1, \boldsymbol w_2, \ldots, \boldsymbol w_m) T P \\
&= (\boldsymbol w_1', \boldsymbol w_2', \ldots, \boldsymbol w_m') Q^{-1} T P
\end{aligned} ( T ( v 1 ′ ) , T ( v 2 ′ ) , … , T ( v n ′ ) ) = ( T ( v 1 ) , T ( v 2 ) , … , T ( v n ) ) P = ( w 1 , w 2 , … , w m ) T P = ( w 1 ′ , w 2 ′ , … , w m ′ ) Q − 1 T P
因此可以得到
X = Q − 1 T P X = Q^{-1} T P
X = Q − 1 T P
命题
令线性变换 f : V → W f: V \to W f : V → W
V V V 中取两组基底 A , A ′ \mathscr A, \mathscr A' A , A ′ ,W W W 中取两组基底 B , B ′ \mathscr B, \mathscr B' B , B ′
分别令 P P P 为从基底 A \mathscr A A 到基底 A ′ \mathscr A' A ′ 的过渡矩阵,Q Q Q 为从基底 B \mathscr B B 到基底 B ′ \mathscr B' B ′ 的过渡矩阵
若令 f f f 在基底 A , B \mathscr A, \mathscr B A , B 下的矩阵表示为 T T T
那么 f f f 在基底 A ′ , B ′ \mathscr A', \mathscr B' A ′ , B ′ 下的矩阵表示为
T ′ = Q − 1 T P T' = Q^{-1} T P
T ′ = Q − 1 T P
证明