# 矩阵在初等数学中,基本的计算单位是单一数字,也就是实数和复数。很显然一个数字只能蕴含一个信息 在线性代数中,数字这一概念将被推广,我们的基本计算单位将转为矩阵
简单来说,称被括号 [ ] [] [ ] 或 ( ) () ( ) 包裹的,多个数字按行与列排列形成的二维数组为 矩阵 (Matrix)「矩阵」 。 例如
A = ( 1 2 3 4 5 6 ) , B = [ 7 8 9 10 11 12 ] A = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix},\quad B = \begin{bmatrix}7 & 8 \\ 9 & 10 \\ 11 & 12 \end{bmatrix} A = ( 1 4 2 5 3 6 ) , B = ⎣ ⎢ ⎡ 7 9 1 1 8 1 0 1 2 ⎦ ⎥ ⎤
具体选取哪一种括号并不重要,但为了统一,本笔记采取圆括号表示矩阵
一个 m m m 行 n n n 列的矩阵称为一个 m × n m \times n m × n 矩阵,在需要表明大小时记作 A m × n A_{m \times n} A m × n ,可以表示为
A m × n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) m × n A_{m \times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}_{m \times n} A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × n
其中 a i j a_{ij} a i j 称为矩阵 A A A 的 第 i i i 行第 j j j 列元素 。也叫做 矩阵的 ( i , j ) (i, j) ( i , j ) 成分 。
也可以简短地利用成分的符号,将矩阵表示为
A m × n = ( a i j ) m × n A_{m \times n} = (a_{ij})_{m \times n} A m × n = ( a i j ) m × n
一个行与列数量相等的矩阵称为 方阵 (Square Matrix)「正方行列」 ,即 m = n m = n m = n 的矩阵。 方阵是很重要的矩阵,通常来说涉及到线性代数应用的计算都建立在方阵的对象上。 一个 n n n 行 n n n 列的方阵称为 n 阶方阵 。记作 A n A_n A n 。即
A n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a n 1 a n 2 ⋯ a n n ) A_n = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} A n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a n 1 a 1 2 a 2 2 ⋮ a n 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a n n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
在方阵中,从左上到右下的元素 a 11 , a 22 , … , a n n a_{11}, a_{22}, \ldots, a_{nn} a 1 1 , a 2 2 , … , a n n 称为 主对角线 (Main Diagonal)「主対角線」 。
两类特殊的矩阵:
行数为 1 1 1 的矩阵称为 行向量 (Row Vector)「行ベクトル」 列数为 1 1 1 的矩阵称为 列向量 (Column Vector)「列ベクトル」 行向量与列向量一般用粗体表示,例如
a = ( 1 2 3 ) , b = ( 4 5 6 ) \boldsymbol a = \begin{pmatrix}1 & 2 & 3\end{pmatrix},\quad \boldsymbol b = \begin{pmatrix}4 \\ 5 \\ 6\end{pmatrix} a = ( 1 2 3 ) , b = ⎝ ⎛ 4 5 6 ⎠ ⎞
除此之外,还有一些具有特殊名称的矩阵
除了主对角线上的元素外,其余元素均为 0 0 0 的方阵称为 对角矩阵 (Diagonal Matrix)「対角行列」 主对角线下方的元素均为 0 0 0 的方阵称为 上三角矩阵 (Upper Triangular Matrix)「上三角行列」 主对角线上方的元素均为 0 0 0 的方阵称为 下三角矩阵 (Lower Triangular Matrix)「下三角行列」 以下 A A A 为对角矩阵,B B B 为上三角矩阵,C C C 为下三角矩阵
A = ( a 11 0 0 0 a 22 0 0 0 a 33 ) , B = ( b 11 b 12 b 13 0 b 22 b 23 0 0 b 33 ) , C = ( c 11 0 0 c 21 c 22 0 c 31 c 32 c 33 ) A = \begin{pmatrix} a_{11} & 0 & 0 \\ 0 & a_{22} & 0 \\ 0 & 0 & a_{33} \end{pmatrix},\quad B = \begin{pmatrix} b_{11} & b_{12} & b_{13} \\ 0 & b_{22} & b_{23} \\ 0 & 0 & b_{33} \end{pmatrix},\quad C = \begin{pmatrix} c_{11} & 0 & 0 \\ c_{21} & c_{22} & 0 \\ c_{31} & c_{32} & c_{33} \end{pmatrix} A = ⎝ ⎛ a 1 1 0 0 0 a 2 2 0 0 0 a 3 3 ⎠ ⎞ , B = ⎝ ⎛ b 1 1 0 0 b 1 2 b 2 2 0 b 1 3 b 2 3 b 3 3 ⎠ ⎞ , C = ⎝ ⎛ c 1 1 c 2 1 c 3 1 0 c 2 2 c 3 2 0 0 c 3 3 ⎠ ⎞
# 矩阵运算不同于单一数字,矩阵具有一个特殊的自我作用的运算:转置 对于一个矩阵 A m × n A_{m \times n} A m × n ,若
A m × n = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A_{m \times n} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
则其 转置 (Transpose)「転置」 定义为
t A m × n = ( a 11 a 21 ⋯ a m 1 a 12 a 22 ⋯ a m 2 ⋮ ⋮ ⋱ ⋮ a 1 n a 2 n ⋯ a m n ) {}^t\!A_{m \times n} = \begin{pmatrix} a_{11} & a_{21} & \cdots & a_{m1} \\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \end{pmatrix} t A m × n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 1 2 ⋮ a 1 n a 2 1 a 2 2 ⋮ a 2 n ⋯ ⋯ ⋱ ⋯ a m 1 a m 2 ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
实际上转置就是让矩阵沿着主对角线翻转,行数和列数也会随之交换,也就是说 m m m 行 n n n 列的矩阵转置后会变为 n n n 行 m m m 列的矩阵 常见地,矩阵 A A A 的转置也被写作 A t , A T , T A A^t, A^T, {}^T\!A A t , A T , T A 等等,本笔记统一使用 t A {}^t\!A t A 的形式表示转置
满足 A = t A A = {}^t\!A A = t A 的矩阵称为 对称矩阵 (Symmetric Matrix)「対称行列」 满足 A = − t A A = -{}^t\!A A = − t A 的矩阵称为 斜对称矩阵 (Skew-Symmetric Matrix)「交代行列」 矩阵也具有加减法,但是矩阵的加减法必须要在两个矩阵的行数与列数都相等的情况 下才能进行,定义矩阵的加法为各个成分对应相加减,即
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) ± ( b 11 b 12 ⋯ b 1 n b 21 b 22 ⋯ b 2 n ⋮ ⋮ ⋱ ⋮ b m 1 b m 2 ⋯ b m n ) = ( a 11 ± b 11 a 12 ± b 12 ⋯ a 1 n ± b 1 n a 21 ± b 21 a 22 ± b 22 ⋯ a 2 n ± b 2 n ⋮ ⋮ ⋱ ⋮ a m 1 ± b m 1 a m 2 ± b m 2 ⋯ a m n ± b m n ) \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} \pm \begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1n} \\ b_{21} & b_{22} & \cdots & b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ b_{m1} & b_{m2} & \cdots & b_{mn} \end{pmatrix} = \begin{pmatrix} a_{11} \pm b_{11} & a_{12} \pm b_{12} & \cdots & a_{1n} \pm b_{1n} \\ a_{21} \pm b_{21} & a_{22} \pm b_{22} & \cdots & a_{2n} \pm b_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} \pm b_{m1} & a_{m2} \pm b_{m2} & \cdots & a_{mn} \pm b_{mn} \end{pmatrix} ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ ± ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ b 1 1 b 2 1 ⋮ b m 1 b 1 2 b 2 2 ⋮ b m 2 ⋯ ⋯ ⋱ ⋯ b 1 n b 2 n ⋮ b m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 ± b 1 1 a 2 1 ± b 2 1 ⋮ a m 1 ± b m 1 a 1 2 ± b 1 2 a 2 2 ± b 2 2 ⋮ a m 2 ± b m 2 ⋯ ⋯ ⋱ ⋯ a 1 n ± b 1 n a 2 n ± b 2 n ⋮ a m n ± b m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
继承于数字运算,矩阵加法具有如下性质
( A + B ) + C = A + ( B + C ) (A + B) + C = A + (B + C) ( A + B ) + C = A + ( B + C ) A + B = B + A A + B = B + A A + B = B + A 矩阵也具备数乘运算(标量积),即对于一个矩阵 A A A 与一个数 k k k ,定义数乘为各个成分与该数相乘,即
k ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) = ( k a 11 k a 12 ⋯ k a 1 n k a 21 k a 22 ⋯ k a 2 n ⋮ ⋮ ⋱ ⋮ k a m 1 k a m 2 ⋯ k a m n ) k \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} = \begin{pmatrix} k a_{11} & k a_{12} & \cdots & k a_{1n} \\ k a_{21} & k a_{22} & \cdots & k a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k a_{m1} & k a_{m2} & \cdots & k a_{mn} \end{pmatrix} k ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ k a 1 1 k a 2 1 ⋮ k a m 1 k a 1 2 k a 2 2 ⋮ k a m 2 ⋯ ⋯ ⋱ ⋯ k a 1 n k a 2 n ⋮ k a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
基于数乘,减法可以用加法与数乘来表示
A − B = A + ( − 1 ) B A - B = A + (-1)B A − B = A + ( − 1 ) B
数乘运算具有如下性质
k ( A + B ) = k A + k B k(A + B) = kA + kB k ( A + B ) = k A + k B ( k + ℓ ) A = k A + ℓ A (k + \ell)A = kA + \ell A ( k + ℓ ) A = k A + ℓ A ( k ℓ ) A = k ( ℓ A ) (k\ell)A = k(\ell A) ( k ℓ ) A = k ( ℓ A ) 1 A = A 1A = A 1 A = A 矩阵可以做乘法,但是矩阵乘法相较于加法与数乘要更为特殊和复杂。 对于一个 m m m 行 n n n 列的矩阵 A A A 与一个 ℓ \ell ℓ 行 k k k 列的矩阵 B B B ,当且仅当 n = ℓ n = \ell n = ℓ 时,矩阵乘法才有定义,定义为
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) m × n ( b 11 b 12 ⋯ b 1 k b 21 b 22 ⋯ b 2 k ⋮ ⋮ ⋱ ⋮ b ℓ 1 b ℓ 2 ⋯ b ℓ k ) ℓ × k = ( c 11 c 12 ⋯ c 1 k c 21 c 22 ⋯ c 2 k ⋮ ⋮ ⋱ ⋮ c m 1 c m 2 ⋯ c m k ) m × k \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}_{m \times n} \begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1k} \\ b_{21} & b_{22} & \cdots & b_{2k} \\ \vdots & \vdots & \ddots & \vdots \\ b_{\ell 1} & b_{\ell 2} & \cdots & b_{\ell k} \end{pmatrix}_{\ell \times k} = \begin{pmatrix} c_{11} & c_{12} & \cdots & c_{1k} \\ c_{21} & c_{22} & \cdots & c_{2k} \\ \vdots & \vdots & \ddots & \vdots \\ c_{m1} & c_{m2} & \cdots & c_{mk} \end{pmatrix}_{m \times k} ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × n ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ b 1 1 b 2 1 ⋮ b ℓ 1 b 1 2 b 2 2 ⋮ b ℓ 2 ⋯ ⋯ ⋱ ⋯ b 1 k b 2 k ⋮ b ℓ k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ ℓ × k = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ c 1 1 c 2 1 ⋮ c m 1 c 1 2 c 2 2 ⋮ c m 2 ⋯ ⋯ ⋱ ⋯ c 1 k c 2 k ⋮ c m k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ m × k
其中
c i j = ∑ r = 1 n a i r b r j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j c_{ij} = \sum_{r=1}^n a_{ir} b_{rj} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj} c i j = r = 1 ∑ n a i r b r j = a i 1 b 1 j + a i 2 b 2 j + ⋯ + a i n b n j
也就是说,矩阵乘法的第 i i i 行第 j j j 列成分是由矩阵 A A A 的第 i i i 行与矩阵 B B B 的第 j j j 列对应成分相乘后求和得到的 最终一个 m m m 行 n n n 列的矩阵与一个 n n n 行 k k k 列的矩阵相乘后会得到一个 m m m 行 k k k 列的矩阵 显然,这个过程通常来说是无法交换顺序的,即一般来说 A B ≠ B A AB \neq BA A B = B A 。因为在矩阵的乘法运算中,前者提供了行的信息,后者提供了列的信息,二者交换顺序后,行与列的信息也会交换,从而导致结果不同
矩阵的乘法具有如下性质
A ( B C ) = ( A B ) C A(BC) = (AB)C A ( B C ) = ( A B ) C A ( B + C ) = A B + A C A(B + C) = AB + AC A ( B + C ) = A B + A C ( A + B ) C = A C + B C (A + B)C = AC + BC ( A + B ) C = A C + B C 示例
\begin{pmatrix} -2 & 0 \\ 1 & 3 \end{pmatrix} + \begin{pmatrix} 4 & 5 \\ -1 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 5 \\ 0 & 5 \end 3 \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} = \begin{pmatrix} 3 & 6 \\ 9 & 12 \end \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix} \begin{pmatrix} 7 & 8 \\ 9 & 10 \\ 11 & 12 \end{pmatrix} = \begin{pmatrix} 58 & 64 \\ 139 & 154 \end 与运算紧密关联的两类特殊矩阵是单位矩阵与零矩阵
单位矩阵 (Identity Matrix)「単位行列」 为主对角线元素均为 1 1 1 ,其余元素均为 0 0 0 的方阵,记作 E n E_n E n 或 I n I_n I n ,不考虑大小时简单记为 E E E 或 I I I 即E n = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 1 ) E_n = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix} E n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
零矩阵 (Zero Matrix)「零行列」 为所有元素均为 0 0 0 的矩阵,记作 O n O_n O n ,不考虑大小时简单记为 O O O 即O = ( 0 0 ⋯ 0 0 0 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ 0 ) O = \begin{pmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 \end{pmatrix} O = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 0 0 ⋮ 0 0 0 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ 0 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
很容易可以验证如下性质:
A + O = O + A = A A + O = O + A = A A + O = O + A = A A − A = O A - A = O A − A = O 0 A = A 0 = O 0A = A0 = O 0 A = A 0 = O A E = E A = A AE = EA = A A E = E A = A A O = O A = O AO = OA = O A O = O A = O 上述运算规则,与初等数学中熟知的数字运算最需要注意的两点是
一般来说矩阵乘法不满足交换律,若 A B = B A AB = BA A B = B A ,则称矩阵 A A A 与 B B B 可交换 即使两个矩阵都不为零矩阵,其乘积也可能为零矩阵,这样的矩阵称为 零因子 ,例如 ( 1 − 1 1 − 1 ) ( 1 1 1 1 ) = ( 0 0 0 0 ) \begin{pmatrix}1 & -1 \\1 & -1\end{pmatrix} \begin{pmatrix}1 & 1 \\1 & 1\end{pmatrix} = \begin{pmatrix}0 & 0 \\0 & 0\end{pmatrix} ( 1 1 − 1 − 1 ) ( 1 1 1 1 ) = ( 0 0 0 0 )
矩阵的幂运算可以由乘法运算自然导出,即
A k = A ⋅ A ⋯ A ⏟ k times A^k = \underbrace{A \cdot A \cdots A}_{k \text{ times}} A k = k times A ⋅ A ⋯ A
其中 k k k 为正整数,且 A A A 必须为方阵
转置运算可以与加法,数乘,乘法共同作用,这很容易验证
t ( A + B ) = t A + t B {}^t(A + B) = {}^t\!A + {}^t\!B t ( A + B ) = t A + t B t ( k A ) = k t A {}^t(kA) = k {}^t\!A t ( k A ) = k t A t ( A B ) = t B t A {}^t(AB) = {}^t\!B \; {}^t\!A t ( A B ) = t B t A 在引入矩阵的运算之后,就可以给出其他与矩阵有关的概念了 第一个需要了解的是逆矩阵,注意逆矩阵只能在方阵 的情况下讨论
定义 令 A A A 为一个 n n n 阶方阵,称 n n n 阶方阵 B B B 为 A A A 的 逆矩阵 (Inverse Matrix)「逆行列」 ,当且仅当
A B = B A = E n AB = BA = E_n A B = B A = E n
命题 逆矩阵若存在,则唯一。
证明 设 B B B 与 C C C 均为 A A A 的逆矩阵,则
B = B E = B ( A C ) = ( B A ) C = E C = C B = BE = B(AC) = (BA)C = EC = C B = B E = B ( A C ) = ( B A ) C = E C = C
□ \square □
注意:并非所有方阵都存在逆矩阵 ,存在逆矩阵的方阵称为 [正则矩阵 (Regular Matrix)「正則行列」 ],否则称为 [奇异矩阵 (Singular Matrix)「特異行列」 ]。
二阶方阵可以快速由以下结论判定
命题 2 2 2 阶方阵
A = ( a b c d ) A = \begin{pmatrix}a & b \\ c & d\end{pmatrix} A = ( a c b d )
成为正则矩阵的充分必要条件为 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 ,此时其逆矩阵为
A − 1 = 1 a d − b c ( d − b − c a ) A^{-1} = \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix} A − 1 = a d − b c 1 ( d − c − b a )
证明 (⇒ \Rightarrow ⇒ ) 设 A A A 存在逆矩阵 A − 1 = ( x y z w ) A^{-1} = \begin{pmatrix}x & y \\ z & w\end{pmatrix} A − 1 = ( x z y w ) ,则
A A − 1 = ( a b c d ) ( x y z w ) = ( 1 0 0 1 ) AA^{-1} = \begin{pmatrix}a & b \\ c & d\end{pmatrix} \begin{pmatrix}x & y \\ z & w\end{pmatrix} = \begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix} A A − 1 = ( a c b d ) ( x z y w ) = ( 1 0 0 1 )
由此可得方程组
{ a x + b z = 1 a y + b w = 0 c x + d z = 0 c y + d w = 1 \begin{cases}ax + bz = 1 \\ ay + bw = 0 \\ cx + dz = 0 \\ cy + dw = 1 \end{cases} ⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎧ a x + b z = 1 a y + b w = 0 c x + d z = 0 c y + d w = 1
解得
x = d a d − b c , y = − b a d − b c , z = − c a d − b c , w = a a d − b c x = \frac{d}{ad - bc},\quad y = \frac{-b}{ad - bc},\quad z = \frac{-c}{ad - bc},\quad w = \frac{a}{ad - bc} x = a d − b c d , y = a d − b c − b , z = a d − b c − c , w = a d − b c a
因此 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 。
(⇐ \Leftarrow ⇐ ) 设 a d − b c ≠ 0 ad - bc \neq 0 a d − b c = 0 ,令
A − 1 = 1 a d − b c ( d − b − c a ) A^{-1} = \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix} A − 1 = a d − b c 1 ( d − c − b a )
则
A A − 1 = ( a b c d ) 1 a d − b c ( d − b − c a ) = ( 1 0 0 1 ) AA^{-1} = \begin{pmatrix}a & b \\ c & d\end{pmatrix} \frac{1}{ad - bc} \begin{pmatrix}d & -b \\ -c & a\end{pmatrix} = \begin{pmatrix}1 & 0 \\ 0 & 1\end{pmatrix} A A − 1 = ( a c b d ) a d − b c 1 ( d − c − b a ) = ( 1 0 0 1 )
同理可证 A − 1 A = E 2 A^{-1}A = E_2 A − 1 A = E 2 ,故 A − 1 A^{-1} A − 1 为 A A A 的逆矩阵。□ \square □
容易验证以下结论:若 A , B A,B A , B 均为 n n n 阶正则矩阵,则
A − 1 A^{-1} A − 1 亦为正则矩阵,且 ( A − 1 ) − 1 = A (A^{-1})^{-1} = A ( A − 1 ) − 1 = A t A {}^t\!A t A 亦为正则矩阵,且 ( t A ) − 1 = t ( A − 1 ) ({}^t\!A)^{-1} = {}^t\!(A^{-1}) ( t A ) − 1 = t ( A − 1 ) A B AB A B 亦为正则矩阵,且 (AB)^{-1} = B^{-1} A^# 矩阵的分割在实际的计算或者推导中,将原有的矩阵划分为若干子矩阵进行处理是很常见的操作,这可以简化计算过程 简单来说,矩阵的分割类似如下形式
A = ( A 11 A 12 A 21 A 22 ) A = \begin{pmatrix}A_{11} & A_{12} \\ A_{21} & A_{22} \end{pmatrix} A = ( A 1 1 A 2 1 A 1 2 A 2 2 )
其中 A 11 , A 12 , A 21 , A 22 A_{11}, A_{12}, A_{21}, A_{22} A 1 1 , A 1 2 , A 2 1 , A 2 2 均为矩阵,称为矩阵 A A A 的 子矩阵 。
考虑一个 m × n m \times n m × n 矩阵 A A A ,和一个 n × ℓ n \times \ell n × ℓ 矩阵 B B B ,此时积 A B AB A B 可以定义。但我们也可以按照如下方式
A = ( A 11 A 12 A 21 A 22 ) , B = ( B 11 B 12 B 21 B 22 ) A = \begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{pmatrix},\quad B = \begin{pmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{pmatrix} A = ( A 1 1 A 2 1 A 1 2 A 2 2 ) , B = ( B 1 1 B 2 1 B 1 2 B 2 2 )
只需要确保 A 11 A_{11} A 1 1 所在位置的行数与 B 11 B_{11} B 1 1 所在位置的列数相等,A 12 A_{12} A 1 2 所在位置的行数与 B 21 B_{21} B 2 1 所在位置的列数相等 那么就可以将矩阵乘法写作
A B = ( A 11 B 11 + A 12 B 21 A 11 B 12 + A 12 B 22 A 21 B 11 + A 22 B 21 A 21 B 12 + A 22 B 22 ) AB = \begin{pmatrix} A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\ A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22} \end{pmatrix} A B = ( A 1 1 B 1 1 + A 1 2 B 2 1 A 2 1 B 1 1 + A 2 2 B 2 1 A 1 1 B 1 2 + A 1 2 B 2 2 A 2 1 B 1 2 + A 2 2 B 2 2 )
特别地,有如下两种分割方式,对于矩阵
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ) A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 a 1 2 a 2 2 ⋮ a m 2 ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
第一种是行向量分割
a 1 = ( a 11 a 12 ⋯ a 1 n ) a 2 = ( a 21 a 22 ⋯ a 2 n ) ⋮ a m = ( a m 1 a m 2 ⋯ a m n ) \begin{aligned} \boldsymbol a_1 & = \begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n}\end{pmatrix} \\ \boldsymbol a_2 & = \begin{pmatrix}a_{21} & a_{22} & \cdots & a_{2n}\end{pmatrix} \\ & \vdots \\ \boldsymbol a_m & = \begin{pmatrix}a_{m1} & a_{m2} & \cdots & a_{mn}\end{pmatrix} \end{aligned} a 1 a 2 a m = ( a 1 1 a 1 2 ⋯ a 1 n ) = ( a 2 1 a 2 2 ⋯ a 2 n ) ⋮ = ( a m 1 a m 2 ⋯ a m n )
此时
A = ( a 1 a 2 ⋮ a m ) A = \begin{pmatrix} \boldsymbol a_1 \\ \boldsymbol a_2 \\ \vdots \\ \boldsymbol a_m \end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 a 2 ⋮ a m ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
第二种是列向量分割
b 1 = ( a 11 a 21 ⋮ a m 1 ) , b 2 = ( a 12 a 22 ⋮ a m 2 ) , … , b n = ( a 1 n a 2 n ⋮ a m n ) \boldsymbol b_1 = \begin{pmatrix}a_{11} \\ a_{21} \\ \vdots \\ a_{m1}\end{pmatrix},\quad \boldsymbol b_2 = \begin{pmatrix}a_{12} \\ a_{22} \\ \vdots \\ a_{m2}\end{pmatrix},\quad \ldots,\quad \boldsymbol b_n = \begin{pmatrix}a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn}\end{pmatrix} b 1 = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 1 a 2 1 ⋮ a m 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , b 2 = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 2 a 2 2 ⋮ a m 2 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , … , b n = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 n a 2 n ⋮ a m n ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
此时
A = ( b 1 b 2 ⋯ b n ) A = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} A = ( b 1 b 2 ⋯ b n )
通过这样的分割方式,对于矩阵 A A A 与矩阵 B B B ,可以分割为
A = ( a 1 a 2 ⋮ a m ) , B = ( b 1 b 2 ⋯ b k ) A = \begin{pmatrix} \boldsymbol a_1 \\ \boldsymbol a_2 \\ \vdots \\ \boldsymbol a_m \end{pmatrix},\quad B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_k \end{pmatrix} A = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 a 2 ⋮ a m ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ , B = ( b 1 b 2 ⋯ b k )
此时
A B = ( a 1 B a 2 B ⋮ a m B ) = ( A b 1 A b 2 ⋯ A b k ) = ( a 1 b 1 a 1 b 2 ⋯ a 1 b k a 2 b 1 a 2 b 2 ⋯ a 2 b k ⋮ ⋮ ⋱ ⋮ a m b 1 a m b 2 ⋯ a m b k ) AB = \begin{pmatrix} \boldsymbol a_1 B \\ \boldsymbol a_2 B \\ \vdots \\ \boldsymbol a_m B \end{pmatrix} = \begin{pmatrix} A \boldsymbol b_1 & A \boldsymbol b_2 & \cdots & A \boldsymbol b_k \end{pmatrix} = \begin{pmatrix} \boldsymbol a_1 \boldsymbol b_1 & \boldsymbol a_1 \boldsymbol b_2 & \cdots & \boldsymbol a_1 \boldsymbol b_k \\ \boldsymbol a_2 \boldsymbol b_1 & \boldsymbol a_2 \boldsymbol b_2 & \cdots & \boldsymbol a_2 \boldsymbol b_k \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol a_m \boldsymbol b_1 & \boldsymbol a_m \boldsymbol b_2 & \cdots & \boldsymbol a_m \boldsymbol b_k \end{pmatrix} A B = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 B a 2 B ⋮ a m B ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = ( A b 1 A b 2 ⋯ A b k ) = ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 b 1 a 2 b 1 ⋮ a m b 1 a 1 b 2 a 2 b 2 ⋮ a m b 2 ⋯ ⋯ ⋱ ⋯ a 1 b k a 2 b k ⋮ a m b k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞