# 简化阶梯形

在线性代数中,一个给出的矩阵往往会被进行各种各样的预处理,从而提炼出最关心的核心信息
其中,最早,也是现在即将开始接触的其中一种,就是简化阶梯形

定义
将矩阵 AA 进行行向量分割

A=(a1a2am)A = \begin{pmatrix} \boldsymbol{a_1} \\ \boldsymbol{a_2} \\ \vdots \\ \boldsymbol{a_m} \end{pmatrix}

称矩阵 AA阶梯形 (Echelon Form)「階段形」,当且仅当满足以下条件:

  • 所有的零向量都位于矩阵的下方
  • 非零向量最左侧的元素称为该行的 先导元
  • 越靠下的行,其先导元位置越靠右

在此基础上,称矩阵 AA简化阶梯形 (Reduced Echelon Form)「簡約階段形」,当且仅当其进一步满足以下条件:

  • 含有主元的列,其余元素均为 00
  • 如果强调行分割,有时也对应的称其为 行阶梯形简化行阶梯形

称矩阵简约化之后,含有的主元数量为矩阵的 秩 (Rank)「階数」,记作 rank(A)\mathrm{rank}(A)
nn 阶方阵 AA 的秩为 nn,则称其为 满秩矩阵
矩阵的秩是其非常重要的概念。通过行化简,可以实现对矩阵的分类,在一定程度上秩相等的矩阵具有共通的性质,这是对矩阵进行化简的重要目的:获取矩阵的秩

命题
AAmmnn 列矩阵,则

rank(A)min(m,n)\mathrm{rank}(A) \leq \min(m, n)

证明

显然,矩阵的主元数量不可能超过行数与列数中的较小值

为了实现将矩阵化为简化阶梯形的目标,需要规定一些基本操作

定义
对矩阵 AA,以下三种操作称为矩阵的 行基本变换 (Elementary Row Operations)「行基本変換」

  • R1:将某一行乘以非零常数 cc
  • R2:将某一行与另一行互换
  • R3:将某一行加上另一行的常数倍
  • 对称地,可以得到 列基本变换 的定义

行基本变换可以导向我们的一个目标:将矩阵化为简化阶梯形

接下来以一个矩阵为例,讲解行化简算法,设矩阵

A=(0023124881212334)A = \begin{pmatrix} 0 & 0 & 2 & -3 & 1 \\ 2 & 4 & -8 & 8 & -12 \\ 1 & 2 & -3 & 3 & -4 \end{pmatrix}

展开过程

第一步是通过交换,先确保最左上方的元素非零

R2R1(2488120023112334)\xrightarrow{R2 \leftrightarrow R1} \begin{pmatrix} 2 & 4 & -8 & 8 & -12 \\ 0 & 0 & 2 & -3 & 1 \\ 1 & 2 & -3 & 3 & -4 \end{pmatrix}

第二步是将第一行的首元素化为 11,获得第一个主元

12R1(124460023112334)\xrightarrow{\frac{1}{2}R1} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 2 & -3 & 1 \\ 1 & 2 & -3 & 3 & -4 \end{pmatrix}

通过第一行的主元,将其他行的对应列元素化为 00

R3R1R3(124460023100112)\xrightarrow{R3 - R1 \to R3} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 2 & -3 & 1 \\ 0 & 0 & 1 & -1 & 2 \end{pmatrix}

接下来让视线完全离开第一行,关注其他部分,重复上述过程

12R2(12446001321200112)\xrightarrow{\frac{1}{2}R2} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 1 & -\frac{3}{2} & \frac{1}{2} \\ 0 & 0 & 1 & -1 & 2 \end{pmatrix}

R3R2R3(1244600132120001232)\xrightarrow{R3 - R2 \to R3} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 1 & -\frac{3}{2} & \frac{1}{2} \\ 0 & 0 & 0 & \frac{1}{2} & \frac{3}{2} \end{pmatrix}

2R3(12446001321200013)\xrightarrow{2R3} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 1 & -\frac{3}{2} & \frac{1}{2} \\ 0 & 0 & 0 & 1 & 3 \end{pmatrix}

至此所有的主元均已确定,接下来通过回代,将主元所在列的其他元素化为 00

R2+32R3R2(124460010500013)\xrightarrow{R2 + \frac{3}{2}R3 \to R2} \begin{pmatrix} 1 & 2 & -4 & 4 & -6 \\ 0 & 0 & 1 & 0 & 5 \\ 0 & 0 & 0 & 1 & 3 \end{pmatrix}

R14R3R1(1240180010500013)\xrightarrow{R1 - 4R3 \to R1} \begin{pmatrix} 1 & 2 & -4 & 0 & -18 \\ 0 & 0 & 1 & 0 & 5 \\ 0 & 0 & 0 & 1 & 3 \end{pmatrix}

R1+4R2R1(120020010500013)\xrightarrow{R1 + 4R2 \to R1} \begin{pmatrix} 1 & 2 & 0 & 0 & 2 \\ 0 & 0 & 1 & 0 & 5 \\ 0 & 0 & 0 & 1 & 3 \end{pmatrix}

最终得到矩阵的行最简形


让我们更加本质地分析行化简这个过程
首先注意一个基本事实:所有的行基本变换都是可逆的

  • R1 的逆变换是将该行乘以 1c\frac{1}{c} \quad
  • R2 的逆变换是再次将该行与另一行互换
  • R3 的逆变换是将该行减去另一行的相同常数倍(加上负数倍)

接下来看如下三个矩阵

  • 第一个是将单位矩阵 EnE_n 的第 ii 变为常数 cc 的矩阵

Pi(c)=(1c1)P_{i}(c) = \begin{pmatrix} 1 & & & & & \\ & \ddots & & & & \\ & & c & & & \\ & & & \ddots & & \\ & & & & 1 & \end{pmatrix}

  • 第二个是将单位矩阵 EnE_n 的第 ii 行与第 jj 行互换的矩阵

Pij=(101101)P_{ij} = \begin{pmatrix} 1 & & & & & & \\ & \ddots & & & & & \\ & & 0 & \cdots & 1 & & \\ & & \vdots & & \vdots & & \\ & & 1 & \cdots & 0 & & \\ & & & & & \ddots & \\ & & & & & & 1 \end{pmatrix}

  • 第三个是将单位矩阵 EnE_n 的第 ii 行加上第 jj 行的常数倍 cc 的矩阵

Pij(c)=(11c11)P_{i j}(c) = \begin{pmatrix} 1 & & & & & & \\ & \ddots & & & & & \\ & & 1 & & & & \\ & & \vdots & \ddots & & & \\ & & c & \ldots & 1 & & \\ & & & & & \ddots & \\ & & & & & & 1 \end{pmatrix}

那么不难验证,行基本变换实际上就是将矩阵左乘以上述三种矩阵之一,这三个矩阵被称为 行基本变换矩阵,具体地:

  • R1 对应左乘 Pi(c)P_i(c),即 Pi(c)AP_i(c)A
  • R2 对应左乘 PijP_{ij},即 PijAP_{ij}A
  • R3 对应左乘 Pij(c)P_{ij}(c),即 Pij(c)AP_{ij}(c)A

同样,因为行基本变换是可逆的,所以上述三种矩阵均为可逆矩阵,其逆矩阵分别为

  • Pi(c)1=Pi(1c)P_i(c)^{-1} = P_i\left(\frac{1}{c}\right)
  • Pij1=PijP_{ij}^{-1} = P_{ij} \quad
  • Pij(c)1=Pij(c)P_{ij}(c)^{-1} = P_{ij}(-c)

由此,我们可以重新以更加严格的语言描述行化简的过程

命题
对于任意的矩阵 AA,都存在有限个行基本变换矩阵 P1,P2,,PkP_1, P_2, \dots, P_k,使得

PkPk1P2P1A=RP_k P_{k-1} \cdots P_2 P_1 A = R

其中 RR 为矩阵 AA 的行最简矩阵

证明

根据行化简的算法可知,可以通过有限次行基本变换将矩阵化为行最简矩阵
\square

# 线性无关

定义
令向量 a1,a2,,ar\boldsymbol{a_1}, \boldsymbol{a_2}, \dots, \boldsymbol{a_r} 为矩阵 AA 的向量分割,称它们为 线性无关 (Linearly Independent)「線形独立」,当且仅当

c1a1+c2a2++crar=0    c1=c2==cr=0c_1 \boldsymbol{a_1} + c_2 \boldsymbol{a_2} + \cdots + c_r \boldsymbol{a_r} = \boldsymbol{0} \iff c_1 = c_2 = \cdots = c_r = 0

否则称为 线性相关 (Linearly Dependent)「線形従属」

  • 在线性相关时,非零系数得到的关系式称为 非自明的线性关系

线性无关指示了各个向量之间是否平行。换句话来说非线性无关的向量组携带了冗余的信息,因为其中个别向量是可以被其他向量线性表示出来的,它们的单独存在没有意义

利用线性无关,可以导出行化简的唯一性

命题
a1,a2,,ar\boldsymbol a_1, \boldsymbol a_2, \dots, \boldsymbol a_rnn 维列向量,PPnn 维正则矩阵,则

a1,a2,,ar Linearly Independent    Pa1,Pa2,,Par Linearly Independent\boldsymbol a_1, \boldsymbol a_2, \dots, \boldsymbol a_r \text{ Linearly Independent} \iff P\boldsymbol a_1, P\boldsymbol a_2, \dots, P\boldsymbol a_r \text{ Linearly Independent}

证明

(\Rightarrow)
设方程

c1Pa1+c2Pa2++cnPan=0c_1 P \boldsymbol a_1 + c_2 P \boldsymbol a_2 + \cdots + c_n P \boldsymbol a_n = \boldsymbol 0

从左侧同时左乘 P1P^{-1},得到

c1a1+c2a2++cnan=0c_1 \boldsymbol a_1 + c_2 \boldsymbol a_2 + \cdots + c_n \boldsymbol a_n = \boldsymbol 0

a1,a2,,ar\boldsymbol a_1, \boldsymbol a_2, \dots, \boldsymbol a_r 线性无关可知 c1=c2==cn=0c_1 = c_2 = \cdots = c_n = 0,因此 Pa1,Pa2,,ParP\boldsymbol a_1, P\boldsymbol a_2, \dots, P\boldsymbol a_r 线性无关

(\Leftarrow)
设方程

c1a1+c2a2++cnan=0c_1 \boldsymbol a_1 + c_2 \boldsymbol a_2 + \cdots + c_n \boldsymbol a_n = \boldsymbol 0

从左侧同时左乘 PP,得到

c1Pa1+c2Pa2++cnPan=0c_1 P \boldsymbol a_1 + c_2 P \boldsymbol a_2 + \cdots + c_n P \boldsymbol a_n = \boldsymbol 0

Pa1,Pa2,,ParP\boldsymbol a_1, P\boldsymbol a_2, \dots, P\boldsymbol a_r 线性无关可知 c1=c2==cn=0c_1 = c_2 = \cdots = c_n = 0,因此 a1,a2,,ar\boldsymbol a_1, \boldsymbol a_2, \dots, \boldsymbol a_r 线性无关
\square

在之前已经论述:可以确保在有限回内行化简任意矩阵,即

PkPk1P2P1A=RP_k P_{k-1} \cdots P_2 P_1 A = R

统合这里的乘积,可以写为

PA=RPA = R

其中 PP 为正则矩阵

命题 行最简矩阵的唯一性
对于任意矩阵 AA,设矩阵 PP 满足

PA=RPA = R

其中 RR 为矩阵 AA 的行最简矩阵,则 RR 唯一

证明

AA 通过行变换化为简化阶梯形 RR。即 PA=RPA=R
对矩阵 A,RA,R 进行列向量分割

A=(a1a2an)R=(r1r2rn)\begin{aligned} A &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \\ R &= \begin{pmatrix} \boldsymbol r_1 & \boldsymbol r_2 & \cdots & \boldsymbol r_n \end{pmatrix} \end{aligned}

根据前述命题,左乘可逆矩阵 PP 不改变向量组的线性相关性。
因此,r1,,rn\boldsymbol r_1, \dots, \boldsymbol r_n 之间的线性关系与 a1,,an\boldsymbol a_1, \dots, \boldsymbol a_n 完全一致。

考察 AA 的列向量。设 aj1\boldsymbol a_{j_1} 是第一个非零列,则 rj1\boldsymbol r_{j_1} 必须是 RR 的第一个主元列(即 e1\boldsymbol e_1)。
接着寻找 aj2\boldsymbol a_{j_2},使得它不能被 aj1\boldsymbol a_{j_1} 线性表示。对应的 rj2\boldsymbol r_{j_2} 即为第二个主元列(e2\boldsymbol e_2)。
依此类推,我们可以唯一确定主元列的下标集合 {j1,j2,,jr}\{j_1, j_2, \dots, j_r\}。这些列在 RR 中必然是单位坐标向量 e1,,er\boldsymbol e_1, \dots, \boldsymbol e_r

对于任意非主元列 ak\boldsymbol a_kk{j1,}k \notin \{j_1, \dots\}),由于主元列构成了基底,ak\boldsymbol a_k 必然可以唯一地表示为主元列的线性组合:

ak=c1aj1+c2aj2++cmajm\boldsymbol a_k = c_1 \boldsymbol a_{j_1} + c_2 \boldsymbol a_{j_2} + \cdots + c_m \boldsymbol a_{j_m}

根据线性关系的同构性,对应的 rk\boldsymbol r_k 也必须满足同样的线性组合:

rk=c1rj1+c2rj2++cmrjm\boldsymbol r_k = c_1 \boldsymbol r_{j_1} + c_2 \boldsymbol r_{j_2} + \cdots + c_m \boldsymbol r_{j_m}

代入 rji=ei\boldsymbol r_{j_i} = \boldsymbol e_i,可得:

rk=(c1c2cm0)\boldsymbol r_k = \begin{pmatrix} c_1 \\ c_2 \\ \vdots \\ c_m \\ 0 \\ \vdots \end{pmatrix}

这意味着 RR 的每一列(无论是主元列还是非主元列)都由 AA 的列向量间的线性关系唯一确定。
因此,RR 是唯一的。
\square