在该线性代数的笔记中,数域符号 F \mathbb F F 指代实数域 R \mathbb R R 或 复数域 C \mathbb C C 中的其中一个。
# 矩阵
在初等数学中,基本的计算单位是单一数字,也就是实数和复数。很显然一个数字只能蕴含一个信息
在线性代数中,数字这一概念将被推广,我们的基本计算单位将转为矩阵
简单来说,称被括号 [ ] [] [ ] 或 ( ) () ( ) 包裹的,多个数字按行与列排列形成的二维数组为 矩阵 (Matrix)「矩阵」 。
例如
A = ( 1 2 3 4 5 6 ) , B = [ 7 8 9 10 11 12 ] A = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6
\end{pmatrix},\quad
B = \begin{bmatrix}7 & 8 \\
9 & 10 \\
11 & 12
\end{bmatrix} A = ( 1 4 2 5 3 6 ) , B = ⎣ ⎢ ⎡ 7 9 1 1 8 1 0 1 2 ⎦ ⎥ ⎤
具体选取哪一种括号并不重要,但为了统一,本笔记采取圆括号表示矩阵
一个 m m m 行 n n n 列的矩阵称为一个 m × n m \times n m × n 矩阵,在需要表明大小时记作 A m × n A_{m \times n} A m × n ,可以表示为
A m × n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) m × n A_{m \times n} = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}_{m \times n} A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × n
其中 a i j a_{ij} a i j 称为矩阵 A A A 的 第 i i i 行第 j j j 列元素 。也叫做 矩阵的 ( i , j ) (i, j) ( i , j ) 成分 。
也可以简短地利用成分的符号,将矩阵表示为
A m × n = ( a i j ) m × n A_{m \times n} = (a_{ij})_{m \times n}
A m × n = ( a i j ) m × n
一个行与列数量相等的矩阵称为 方阵 (Square Matrix)「正方行列」 ,即 m = n m = n m = n 的矩阵。
方阵是很重要的矩阵,通常来说涉及到线性代数应用的计算都建立在方阵的对象上。
一个 n n n 行 n n n 列的方阵称为 n 阶方阵 。记作 A n A_n A n 。即
A n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ) A_n = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix} A n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a n 1 a 1 2 a 2 2 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a n n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
在方阵中,从左上到右下的元素 a 11 , a 22 , … , a n n a_{11}, a_{22}, \ldots, a_{nn} a 1 1 , a 2 2 , … , a n n 称为 主对角线 (Main Diagonal)「主対角線」 。
记 n n n 阶,以 F \mathbb F F 作为元素的方阵集合为 M n ( F ) M_n(\mathbb F) M n ( F ) 。
例如实数域上的 2 2 2 阶方阵集合记作 M 2 ( R ) M_2(\mathbb R) M 2 ( R ) 。
复数域上的 3 3 3 阶方阵集合记作 M 3 ( C ) M_3(\mathbb C) M 3 ( C ) 。
两类特殊的矩阵:
行数为 1 1 1 的矩阵称为 行向量 (Row Vector)「行ベクトル」
列数为 1 1 1 的矩阵称为 列向量 (Column Vector)「列ベクトル」
行向量与列向量一般用粗体表示,例如
a = ( 1 2 3 ) , b = ( 4 5 6 ) \boldsymbol a = \begin{pmatrix}1 & 2 & 3\end{pmatrix},\quad \boldsymbol b = \begin{pmatrix}4 \\ 5 \\ 6\end{pmatrix}
a = ( 1 2 3 ) , b = ⎝ ⎛ 4 5 6 ⎠ ⎞
除此之外,还有一些具有特殊名称的矩阵
除了主对角线上的元素外,其余元素均为 0 0 0 的方阵称为 对角矩阵 (Diagonal Matrix)「対角行列」
主对角线下方的元素均为 0 0 0 的方阵称为 上三角矩阵 (Upper Triangular Matrix)「上三角行列」
主对角线上方的元素均为 0 0 0 的方阵称为 下三角矩阵 (Lower Triangular Matrix)「下三角行列」
以下 A A A 为对角矩阵,B B B 为上三角矩阵,C C C 为下三角矩阵
A = ( a 11 0 0 0 a 22 0 0 0 a 33 ) , B = ( b 11 b 12 b 13 0 b 22 b 23 0 0 b 33 ) , C = ( c 11 0 0 c 21 c 22 0 c 31 c 32 c 33 ) A = \begin{pmatrix}
a_{11} & 0 & 0 \\
0 & a_{22} & 0 \\
0 & 0 & a_{33}
\end{pmatrix},\quad
B = \begin{pmatrix}
b_{11} & b_{12} & b_{13} \\
0 & b_{22} & b_{23} \\
0 & 0 & b_{33}
\end{pmatrix},\quad
C = \begin{pmatrix}
c_{11} & 0 & 0 \\
c_{21} & c_{22} & 0 \\
c_{31} & c_{32} & c_{33}
\end{pmatrix} A = ⎝ ⎛ a 1 1 0 0 0 a 2 2 0 0 0 a 3 3 ⎠ ⎞ , B = ⎝ ⎛ b 1 1 0 0 b 1 2 b 2 2 0 b 1 3 b 2 3 b 3 3 ⎠ ⎞ , C = ⎝ ⎛ c 1 1 c 2 1 c 3 1 0 c 2 2 c 3 2 0 0 c 3 3 ⎠ ⎞
# 矩阵运算
不同于单一数字,矩阵具有一个特殊的自我作用的运算:转置
对于一个矩阵 A m × n A_{m \times n} A m × n ,若
A m × n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A_{m \times n} = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
则其 转置 (Transpose)「転置」 定义为
t A m × n = ( a 11 a 21 ⋯ a m 1 a 12 a 22 ⋯ a m 2 ⋮ ⋮ ⋱ ⋮ a 1 n a 2 n ⋯ a m n ) {}^t\!A_{m \times n} = \begin{pmatrix}
a_{11} & a_{21} & \cdots & a_{m1} \\
a_{12} & a_{22} & \cdots & a_{m2} \\
\vdots & \vdots & \ddots & \vdots \\
a_{1n} & a_{2n} & \cdots & a_{mn}
\end{pmatrix} t A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 1 2 ⋮ a 1 n a 2 1 a 2 2 ⋮ a 2 n ⋯ ⋯ ⋱ ⋯ a m 1 a m 2 ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
实际上转置就是让矩阵沿着主对角线翻转,行数和列数也会随之交换,也就是说 m m m 行 n n n 列的矩阵转置后会变为 n n n 行 m m m 列的矩阵
常见地,矩阵 A A A 的转置也被写作 A t , A T , T A A^t, A^T, {}^T\!A A t , A T , T A 等等,本笔记统一使用 t A {}^t\!A t A 的形式表示转置
满足 A = t A A = {}^t\!A A = t A 的矩阵称为 对称矩阵 (Symmetric Matrix)「対称行列」
n n n 阶对称矩阵全体记为 S y m n ( F ) \mathrm{Sym}_n(\mathbb F) S y m n ( F )
满足 A = − t A A = -{}^t\!A A = − t A 的矩阵称为 斜对称矩阵 (Skew-Symmetric Matrix)「交代行列」
n n n 阶斜对称矩阵全体记为 A l t n ( F ) \mathrm{Alt}_n(\mathbb F) A l t n ( F )
矩阵也具有加减法,但是矩阵的加减法必须要在两个矩阵的行数与列数都相等的情况 下才能进行,定义矩阵的加法为各个成分对应相加减,即
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) ± ( b 11 b 12 ⋯ b 1 n b 21 b 22 ⋯ b 2 n ⋮ ⋮ ⋱ ⋮ b m 1 b m 2 ⋯ b m n ) = ( a 11 ± b 11 a 12 ± b 12 ⋯ a 1 n ± b 1 n a 21 ± b 21 a 22 ± b 22 ⋯ a 2 n ± b 2 n ⋮ ⋮ ⋱ ⋮ a m 1 ± b m 1 a m 2 ± b m 2 ⋯ a m n ± b m n ) \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} \pm \begin{pmatrix}
b_{11} & b_{12} & \cdots & b_{1n} \\
b_{21} & b_{22} & \cdots & b_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
b_{m1} & b_{m2} & \cdots & b_{mn}
\end{pmatrix} = \begin{pmatrix}
a_{11} \pm b_{11} & a_{12} \pm b_{12} & \cdots & a_{1n} \pm b_{1n} \\
a_{21} \pm b_{21} & a_{22} \pm b_{22} & \cdots & a_{2n} \pm b_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} \pm b_{m1} & a_{m2} \pm b_{m2} & \cdots & a_{mn} \pm b_{mn}
\end{pmatrix} ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ ± ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ b 1 1 b 2 1 ⋮ b m 1 b 1 2 b 2 2 ⋮ b m 2 ⋯ ⋯ ⋱ ⋯ b 1 n b 2 n ⋮ b m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 ± b 1 1 a 2 1 ± b 2 1 ⋮ a m 1 ± b m 1 a 1 2 ± b 1 2 a 2 2 ± b 2 2 ⋮ a m 2 ± b m 2 ⋯ ⋯ ⋱ ⋯ a 1 n ± b 1 n a 2 n ± b 2 n ⋮ a m n ± b m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
继承于数字运算,矩阵加法具有如下性质
( A + B ) + C = A + ( B + C ) (A + B) + C = A + (B + C) ( A + B ) + C = A + ( B + C )
A + B = B + A A + B = B + A A + B = B + A
矩阵也具备数乘运算(标量积),即对于一个矩阵 A A A 与一个数 k k k ,定义数乘为各个成分与该数相乘,即
k ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) = ( k a 11 k a 12 ⋯ k a 1 n k a 21 k a 22 ⋯ k a 2 n ⋮ ⋮ ⋱ ⋮ k a m 1 k a m 2 ⋯ k a m n ) k \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} = \begin{pmatrix}
k a_{11} & k a_{12} & \cdots & k a_{1n} \\
k a_{21} & k a_{22} & \cdots & k a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
k a_{m1} & k a_{m2} & \cdots & k a_{mn}
\end{pmatrix} k ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k a 1 1 k a 2 1 ⋮ k a m 1 k a 1 2 k a 2 2 ⋮ k a m 2 ⋯ ⋯ ⋱ ⋯ k a 1 n k a 2 n ⋮ k a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
基于数乘,减法可以用加法与数乘来表示
A − B = A + ( − 1 ) B A - B = A + (-1)B
A − B = A + ( − 1 ) B
数乘运算具有如下性质
k ( A + B ) = k A + k B k(A + B) = kA + kB k ( A + B ) = k A + k B
( k + ℓ ) A = k A + ℓ A (k + \ell)A = kA + \ell A ( k + ℓ ) A = k A + ℓ A
( k ℓ ) A = k ( ℓ A ) (k\ell)A = k(\ell A) ( k ℓ ) A = k ( ℓ A )
1 A = A 1A = A 1 A = A
矩阵可以做乘法,但是矩阵乘法相较于加法与数乘要更为特殊和复杂。
对于一个 m m m 行 n n n 列的矩阵 A A A 与一个 ℓ \ell ℓ 行 k k k 列的矩阵 B B B ,当且仅当 n = ℓ n = \ell n = ℓ 时,矩阵乘法才有定义,定义为
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) m × n ( b 11 b 12 ⋯ b 1 k b 21 b 22 ⋯ b 2 k ⋮ ⋮ ⋱ ⋮ b ℓ 1 b ℓ 2 ⋯ b ℓ k ) ℓ × k = ( c 11 c 12 ⋯ c 1 k c 21 c 22 ⋯ c 2 k ⋮ ⋮ ⋱ ⋮ c m 1 c m 2 ⋯ c m k ) m × k \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}_{m \times n} \begin{pmatrix}
b_{11} & b_{12} & \cdots & b_{1k} \\
b_{21} & b_{22} & \cdots & b_{2k} \\
\vdots & \vdots & \ddots & \vdots \\
b_{\ell 1} & b_{\ell 2} & \cdots & b_{\ell k}
\end{pmatrix}_{\ell \times k} = \begin{pmatrix}
c_{11} & c_{12} & \cdots & c_{1k} \\
c_{21} & c_{22} & \cdots & c_{2k} \\
\vdots & \vdots & \ddots & \vdots \\
c_{m1} & c_{m2} & \cdots & c_{mk}
\end{pmatrix}_{m \times k} ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × n ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ b 1 1 b 2 1 ⋮ b ℓ 1 b 1 2 b 2 2 ⋮ b ℓ 2 ⋯ ⋯ ⋱ ⋯ b 1 k b 2 k ⋮ b ℓ k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ ℓ × k = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ c 1 1 c 2 1 ⋮ c m 1 c 1 2 c 2 2 ⋮ c m 2 ⋯ ⋯ ⋱ ⋯ c 1 k c 2 k ⋮ c m k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × k
其中
c i j = ∑ r = 1 n a i r b r j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j c_{ij} = \sum_{r=1}^n a_{ir} b_{rj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj}
c i j = r = 1 ∑ n a i r b r j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j
也就是说,矩阵乘法的第 i i i 行第 j j j 列成分是由矩阵 A A A 的第 i i i 行与矩阵 B B B 的第 j j j 列对应成分相乘后求和得到的
最终一个 m m m 行 n n n 列的矩阵与一个 n n n 行 k k k 列的矩阵相乘后会得到一个 m m m 行 k k k 列的矩阵
显然,这个过程通常来说是无法交换顺序的,即一般来说 A B ≠ B A AB \neq BA A B = B A 。因为在矩阵的乘法运算中,前者提供了行的信息,后者提供了列的信息,二者交换顺序后,行与列的信息也会交换,从而导致结果不同
矩阵的乘法具有如下性质
A ( B C ) = ( A B ) C A(BC) = (AB)C A ( B C ) = ( A B ) C
A ( B + C ) = A B + A C A(B + C) = AB + AC A ( B + C ) = A B + A C
( A + B ) C = A C + B C (A + B)C = AC + BC ( A + B ) C = A C + B C
示例
( − 2 0 1 3 ) + ( 4 5 − 1 2 ) = ( 2 5 0 5 ) \begin{pmatrix}
-2 & 0 \\
1 & 3
\end{pmatrix} + \begin{pmatrix}
4 & 5 \\
-1 & 2
\end{pmatrix} = \begin{pmatrix}
2 & 5 \\
0 & 5
\end{pmatrix} \quad \quad ( − 2 1 0 3 ) + ( 4 − 1 5 2 ) = ( 2 0 5 5 )
3 ( 1 2 3 4 ) = ( 3 6 9 12 ) 3 \begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix} = \begin{pmatrix}
3 & 6 \\
9 & 12
\end{pmatrix} \quad 3 ( 1 3 2 4 ) = ( 3 9 6 1 2 )
( 1 2 3 4 5 6 ) ( 7 8 9 10 11 12 ) = ( 58 64 139 154 ) \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6
\end{pmatrix} \begin{pmatrix}
7 & 8 \\
9 & 10 \\
11 & 12
\end{pmatrix} = \begin{pmatrix}
58 & 64 \\
139 & 154
\end{pmatrix} \quad ( 1 4 2 5 3 6 ) ⎝ ⎛ 7 9 1 1 8 1 0 1 2 ⎠ ⎞ = ( 5 8 1 3 9 6 4 1 5 4 )
与运算紧密关联的两类特殊矩阵是单位矩阵与零矩阵
单位矩阵 (Identity Matrix)「単位行列」 为主对角线元素均为 1 1 1 ,其余元素均为 0 0 0 的方阵,记作 E n E_n E n 或 I n I_n I n ,不考虑大小时简单记为 E E E 或 I I I 即
E n = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ) E_n = \begin{pmatrix}
1 & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 1
\end{pmatrix} E n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
零矩阵 (Zero Matrix)「零行列」 为所有元素均为 0 0 0 的矩阵,记作 O n O_n O n ,不考虑大小时简单记为 O O O 即
O = ( 0 0 ⋯ 0 0 0 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 0 ) O = \begin{pmatrix}
0 & 0 & \cdots & 0 \\
0 & 0 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 0
\end{pmatrix} O = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 0 0 ⋮ 0 0 0 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 0 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
很容易可以验证如下性质:
A + O = O + A = A A + O = O + A = A A + O = O + A = A
A − A = O A - A = O A − A = O
0 A = A 0 = O 0A = A0 = O 0 A = A 0 = O
A E = E A = A AE = EA = A A E = E A = A
A O = O A = O AO = OA = O A O = O A = O
上述运算规则,与初等数学中熟知的数字运算最需要注意的两点是
一般来说矩阵乘法不满足交换律,若 A B = B A AB = BA A B = B A ,则称矩阵 A A A 与 B B B 可交换
即使两个矩阵都不为零矩阵,其乘积也可能为零矩阵,这样的矩阵称为 零因子 ,例如
( 1 − 1 1 − 1 ) ( 1 1 1 1 ) = ( 0 0 0 0 ) \begin{pmatrix}1 & -1 \\1 & -1\end{pmatrix}
\begin{pmatrix}1 & 1 \\1 & 1\end{pmatrix} =
\begin{pmatrix}0 & 0 \\0 & 0\end{pmatrix} ( 1 1 − 1 − 1 ) ( 1 1 1 1 ) = ( 0 0 0 0 )
矩阵的幂运算可以由乘法运算自然导出,即
A k = A ⋅ A ⋯ A ⏟ k times A^k = \underbrace{A \cdot A \cdots A}_{k \text{ times}}
A k = k times A ⋅ A ⋯ A
其中 k k k 为正整数,且 A A A 必须为方阵
转置运算可以与加法,数乘,乘法共同作用,这很容易验证
t ( A + B ) = t A + t B {}^t(A + B) = {}^t\!A + {}^t\!B t ( A + B ) = t A + t B
t ( k A ) = k t A {}^t(kA) = k {}^t\!A t ( k A ) = k t A
t ( A B ) = t B t A {}^t(AB) = {}^t\!B \; {}^t\!A t ( A B ) = t B t A
在引入矩阵的运算之后,就可以给出其他与矩阵有关的概念了
第一个需要了解的是逆矩阵,注意逆矩阵只能在方阵 的情况下讨论
定义
令 A A A 为一个 n n n 阶方阵,称 n n n 阶方阵 B B B 为 A A A 的 逆矩阵 (Inverse Matrix)「逆行列」 ,当且仅当
A B = B A = E n AB = BA = E_n
A B = B A = E n
命题
逆矩阵若存在,则唯一。
证明
设 B B B 与 C C C 均为 A A A 的逆矩阵,则
B = B E = B ( A C ) = ( B A ) C = E C = C B = BE = B(AC) = (BA)C = EC = C
B = B E = B ( A C ) = ( B A ) C = E C = C
□ \square □
注意:并非所有方阵都存在逆矩阵 ,存在逆矩阵的方阵称为 正则矩阵 (Regular Matrix)「正則行列」 ,否则称为 奇异矩阵 (Singular Matrix)「特異行列」 。
n n n 阶正则矩阵全体记为 G L n ( F ) \mathrm{GL}_n(\mathbb F) G L n ( F )
二阶方阵可以快速由以下结论判定
命题
2 2 2 阶方阵
A = ( a b c d ) A = \begin{pmatrix}a & b \\ c & d\end{pmatrix}
A = ( a c b d )
成为正则矩阵的充分必要条件为 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 ,此时其逆矩阵为
A − 1 = 1 a d − b c ( d − b − c a ) A^{-1} = \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix}
A − 1 = a d − b c 1 ( d − c − b a )
证明
(⇒ \Rightarrow ⇒ )
设 A A A 存在逆矩阵 A − 1 = ( x y z w ) A^{-1} = \begin{pmatrix}x & y \\ z & w\end{pmatrix} A − 1 = ( x z y w ) ,则
A A − 1 = ( a b c d ) ( x y z w ) = ( 1 0 0 1 ) AA^{-1} = \begin{pmatrix}a & b \\ c & d\end{pmatrix} \begin{pmatrix}x & y \\ z & w\end{pmatrix} = \begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}
A A − 1 = ( a c b d ) ( x z y w ) = ( 1 0 0 1 )
由此可得方程组
{ a x + b z = 1 a y + b w = 0 c x + d z = 0 c y + d w = 1 \begin{cases}ax + bz = 1 \\
ay + bw = 0 \\
cx + dz = 0 \\
cy + dw = 1
\end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎧ a x + b z = 1 a y + b w = 0 c x + d z = 0 c y + d w = 1
解得
x = d a d − b c , y = − b a d − b c , z = − c a d − b c , w = a a d − b c x = \frac{d}{ad - bc},\quad y = \frac{-b}{ad - bc},\quad z = \frac{-c}{ad - bc},\quad w = \frac{a}{ad - bc}
x = a d − b c d , y = a d − b c − b , z = a d − b c − c , w = a d − b c a
因此 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 。
(⇐ \Leftarrow ⇐ )
设 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 ,令
A − 1 = 1 a d − b c ( d − b − c a ) A^{-1} = \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix}
A − 1 = a d − b c 1 ( d − c − b a )
则
A A − 1 = ( a b c d ) 1 a d − b c ( d − b − c a ) = ( 1 0 0 1 ) AA^{-1} = \begin{pmatrix}a & b \\ c & d\end{pmatrix} \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix} = \begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix}
A A − 1 = ( a c b d ) a d − b c 1 ( d − c − b a ) = ( 1 0 0 1 )
同理可证 A − 1 A = E 2 A^{-1}A = E_2 A − 1 A = E 2 ,故 A − 1 A^{-1} A − 1 为 A A A 的逆矩阵。
□ \square □
容易验证以下结论:若 A , B A,B A , B 均为 n n n 阶正则矩阵,则
A − 1 A^{-1} A − 1 亦为正则矩阵,且 ( A − 1 ) − 1 = A (A^{-1})^{-1} = A ( A − 1 ) − 1 = A
t A {}^t\!A t A 亦为正则矩阵,且 ( t A ) − 1 = t ( A − 1 ) ({}^t\!A)^{-1} = {}^t\!(A^{-1}) ( t A ) − 1 = t ( A − 1 )
A B AB A B 亦为正则矩阵,且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1} A^{-1} \quad ( A B ) − 1 = B − 1 A − 1
# 矩阵的分割
在实际的计算或者推导中,将原有的矩阵划分为若干子矩阵进行处理是很常见的操作,这可以简化计算过程
简单来说,矩阵的分割类似如下形式
A = ( A 11 A 12 A 21 A 22 ) A = \left(
\begin{array}{c|c}
A_{11} & A_{12} \\
\hline
A_{21} & A_{22}
\end{array}
\right) A = ( A 1 1 A 2 1 A 1 2 A 2 2 )
其中 A 11 , A 12 , A 21 , A 22 A_{11}, A_{12}, A_{21}, A_{22} A 1 1 , A 1 2 , A 2 1 , A 2 2 均为矩阵,称为矩阵 A A A 的 子矩阵 。
考虑一个 m × n m \times n m × n 矩阵 A A A ,和一个 n × ℓ n \times \ell n × ℓ 矩阵 B B B ,此时积 A B AB A B 可以定义。但我们也可以按照如下方式
A = ( A 11 A 12 A 21 A 22 ) , B = ( B 11 B 12 B 21 B 22 ) A = \left(
\begin{array}{c|c}
A_{11} & A_{12} \\
\hline
A_{21} & A_{22}
\end{array}
\right),\quad B = \left(
\begin{array}{c|c}
B_{11} & B_{12} \\
\hline
B_{21} & B_{22}
\end{array}
\right) A = ( A 1 1 A 2 1 A 1 2 A 2 2 ) , B = ( B 1 1 B 2 1 B 1 2 B 2 2 )
来分割矩阵 A A A 与矩阵 B B B ,只需要确保 A A A 的列分块方式与 B B B 的行分块方式一致。即 A i k A_{ik} A i k 的列数等于 B k j B_{kj} B k j 的行数
即,如果我们把 A A A 在列方向上切两刀,那么 B B B 必须在行方向上切同样位置的两刀。
那么就可以将矩阵乘法写作
A B = ( A 11 B 11 + A 12 B 21 A 11 B 12 + A 12 B 22 A 21 B 11 + A 22 B 21 A 21 B 12 + A 22 B 22 ) AB = \begin{pmatrix}
A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\
A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22}
\end{pmatrix} A B = ( A 1 1 B 1 1 + A 1 2 B 2 1 A 2 1 B 1 1 + A 2 2 B 2 1 A 1 1 B 1 2 + A 1 2 B 2 2 A 2 1 B 1 2 + A 2 2 B 2 2 )
特别地,有如下两种分割方式,对于矩阵
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
第一种是行向量分割
a 1 = ( a 11 a 12 ⋯ a 1 n ) a 2 = ( a 21 a 22 ⋯ a 2 n ) ⋮ a m = ( a m 1 a m 2 ⋯ a m n ) \begin{aligned}
\boldsymbol a_1 & = \begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n}\end{pmatrix} \\
\boldsymbol a_2 & = \begin{pmatrix}a_{21} & a_{22} & \cdots & a_{2n}\end{pmatrix} \\
& \vdots \\
\boldsymbol a_m & = \begin{pmatrix}a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix}
\end{aligned} a 1 a 2 a m = ( a 1 1 a 1 2 ⋯ a 1 n ) = ( a 2 1 a 2 2 ⋯ a 2 n ) ⋮ = ( a m 1 a m 2 ⋯ a m n )
此时
A = ( a 1 a 2 ⋮ a m ) A = \begin{pmatrix}
\boldsymbol a_1 \\
\boldsymbol a_2 \\
\vdots \\
\boldsymbol a_m
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 a 2 ⋮ a m ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
第二种是列向量分割
b 1 = ( a 11 a 21 ⋮ a m 1 ) , b 2 = ( a 12 a 22 ⋮ a m 2 ) , … , b n = ( a 1 n a 2 n ⋮ a m n ) \boldsymbol b_1 = \begin{pmatrix}a_{11} \\ a_{21} \\ \vdots \\ a_{m1}\end{pmatrix},\quad
\boldsymbol b_2 = \begin{pmatrix}a_{12} \\ a_{22} \\ \vdots \\ a_{m2}\end{pmatrix},\quad
\ldots,\quad
\boldsymbol b_n = \begin{pmatrix}a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn}\end{pmatrix} b 1 = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , b 2 = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 2 a 2 2 ⋮ a m 2 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , … , b n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
此时
A = ( b 1 b 2 ⋯ b n ) A = \begin{pmatrix}
\boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n
\end{pmatrix} A = ( b 1 b 2 ⋯ b n )
通过这样的分割方式,对于矩阵 A A A 与矩阵 B B B ,可以分割为
A = ( a 1 a 2 ⋮ a m ) , B = ( b 1 b 2 ⋯ b k ) A = \begin{pmatrix}
\boldsymbol a_1 \\
\boldsymbol a_2 \\
\vdots \\
\boldsymbol a_m
\end{pmatrix},\quad B = \begin{pmatrix}
\boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_k
\end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 a 2 ⋮ a m ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , B = ( b 1 b 2 ⋯ b k )
此时
A B = ( a 1 B a 2 B ⋮ a m B ) = ( A b 1 A b 2 ⋯ A b k ) = ( a 1 b 1 a 1 b 2 ⋯ a 1 b k a 2 b 1 a 2 b 2 ⋯ a 2 b k ⋮ ⋮ ⋱ ⋮ a m b 1 a m b 2 ⋯ a m b k ) AB = \begin{pmatrix}
\boldsymbol a_1 B \\
\boldsymbol a_2 B \\
\vdots \\
\boldsymbol a_m B
\end{pmatrix} = \begin{pmatrix}
A \boldsymbol b_1 & A \boldsymbol b_2 & \cdots & A \boldsymbol b_k
\end{pmatrix} = \begin{pmatrix}
\boldsymbol a_1 \boldsymbol b_1 & \boldsymbol a_1 \boldsymbol b_2 & \cdots & \boldsymbol a_1 \boldsymbol b_k \\
\boldsymbol a_2 \boldsymbol b_1 & \boldsymbol a_2 \boldsymbol b_2 & \cdots & \boldsymbol a_2 \boldsymbol b_k \\
\vdots & \vdots & \ddots & \vdots \\
\boldsymbol a_m \boldsymbol b_1 & \boldsymbol a_m \boldsymbol b_2 & \cdots & \boldsymbol a_m \boldsymbol b_k
\end{pmatrix} A B = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 B a 2 B ⋮ a m B ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ( A b 1 A b 2 ⋯ A b k ) = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 b 1 a 2 b 1 ⋮ a m b 1 a 1 b 2 a 2 b 2 ⋮ a m b 2 ⋯ ⋯ ⋱ ⋯ a 1 b k a 2 b k ⋮ a m b k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞