我们在研究一个行列时,实际上是在研究其所蕴含的信息。
很多时候,我们并不关注内部的一些大数字,而是在意成分的互相关系。
所以在面对一些复杂的矩阵时,一个思路是被期待的:是否可以让复杂的行列通过某种变换,成为一个简单漂亮的行列,并且还可以尽可能地保留原矩阵的信息?

请注意:特征值的讨论对象仅局限于 方阵,对于非方阵无法进行特征值的讨论,但是可以进行奇异值的讨论

# 特征值

为了解答第一个问题:到底什么样的信息是被需要的,需要引入以下内容

定义
AA 为系数域 F\mathbb F 上的 nn 阶方阵
称数 λK\lambda \in K 为矩阵 AA特征值 (Eigenvalue)「固有値」,当且仅当存在非零列向量 xKn\boldsymbol x \in K^n,使得

Ax=λxA \boldsymbol x = \lambda \boldsymbol x

称对应的向量 x\boldsymbol x 为矩阵 AA 关于特征值 λ\lambda特征向量 (Eigenvector)「固有ベクトル」

特征值是我们可以从一个复杂的矩阵中,首先提取出来的核心信息
它一定程度地指示了矩阵的在某个,以及多个方向上的伸缩比例

为了求解矩阵的特征值,先将条件式 Ax=λxA \boldsymbol x = \lambda \boldsymbol x 变形为

(AλI)x=0(A - \lambda I) \boldsymbol x = \boldsymbol 0

解向量 x\boldsymbol x 非零等价于存在非自明解,等价于矩阵 AλIA - \lambda I 不可逆
由此可以得到特征值的等价条件

det(AλI)=0\det(A - \lambda I) = 0

det(AλI)\det(A - \lambda I) 为矩阵 AA特征多项式 (Characteristic Polynomial)「固有多項式」,记作 FA(λ)F_A(\lambda)
解出该方程的根即可得到矩阵 AA 的所有特征值


显然:由于特征值是矩阵所蕴含的重要信息,那么如果两个不相等的矩阵具有相同的特征值,那么它们之间一定存在某种联系

命题
A,BA, B 为系数域 KK 上的 nn 阶方阵
若存在可逆矩阵 PP,使得

B=P1APB = P^{-1} A P

则称矩阵 AA 与矩阵 BB 相似,并且此时 AABB 具有相同的特征多项式,进而具有相同的特征值

证明

FB(λ)=det(BλI)=det(P1APλI)=det(P1APλP1P)=det(P1(AλI)P)=det(P1)det(AλI)det(P)=det(AλI)=FA(λ)\begin{aligned} F_B(\lambda) &= \det(B - \lambda I) \\ &= \det(P^{-1} A P - \lambda I) \\ &= \det(P^{-1} A P - \lambda P^{-1} P) \\ &= \det(P^{-1} (A - \lambda I) P) \\ &= \det(P^{-1}) \det(A - \lambda I) \det(P) \\ &= \det(A - \lambda I) \\ &= F_A(\lambda) \end{aligned}

\square


在确定什么样的信息应该被保留后,接下来就要考虑如何在保持特征值不变的情况下,将矩阵转换为一个更简单的形式
显然,因为相似变换不会改变矩阵的特征值,所以是否可以利用相似变换来达到目的是首要考虑的问题。这样的变换被称为 对角化 (Diagonalization)「対角化」

即,求解可逆矩阵 PP,使得

P1AP=D=(μ1000μ2000μn)P^{-1} A P = D = \begin{pmatrix} \mu_1 & 0 & \cdots & 0 \\ 0 & \mu_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \mu_n \end{pmatrix}

显然此时有等式 AP=PDA P = P D 成立,通过对 PP 进行列分解,可以得到

A(p1p2pn)=(p1p2pn)(μ1000μ2000μn)A \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} = \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} \begin{pmatrix} \mu_1 & 0 & \cdots & 0 \\ 0 & \mu_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \mu_n \end{pmatrix}

等价于

Api=μipi,i=1,2,,nA \boldsymbol p_i = \mu_i \boldsymbol p_i, \quad i = 1, 2, \ldots, n

并且,由于等式组中 μi\mu_ipi\boldsymbol p_i 标号一致,这意味着,矩阵 PP 的拼接顺序会决定对角矩阵 DD 的结果
所以 DD 中的对角成分一定是矩阵 AA 的特征值按顺序排列的结果,即

(p1p2pn)1A(p1p2pn)=(λ1000λ2000λn)\begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix}^{-1} A \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}

命题
nn 阶方阵 AA 可对角化的充分必要条件为:矩阵 AA 存在 nn 个线性无关的特征向量

证明

(\Rightarrow)
假设 AA 可对角化,则存在可逆矩阵 PP,使得

P1AP=(λ1000λ2000λn)=:DP^{-1} A P = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix} =: D

等价于等式

Api=λipi,i=1,2,,nA \boldsymbol p_i = \lambda_i \boldsymbol p_i, \quad i = 1, 2, \ldots, n

由于 PP 可逆,所以各个 pi0\boldsymbol p_i \neq \boldsymbol 0,这意味着各个 pi\boldsymbol p_i 均为矩阵 AA 的特征向量
根据 PP 的正则性,可知 p1,p2,,pn\boldsymbol p_1, \boldsymbol p_2, \ldots, \boldsymbol p_n 线性无关

(\Leftarrow)
假设存在 nn 个线性无关的特征向量 pi\boldsymbol p_i,满足

Api=λipi,i=1,2,,nA \boldsymbol p_i = \lambda_i \boldsymbol p_i, \quad i = 1, 2, \ldots, n

其中各个 λi\lambda_i 为矩阵 AA 的特征值

将其改写为矩阵形式

A(p1p2pn)=(p1p2pn)(λ1000λ2000λn)A \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} = \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}

由于 p1,p2,,pn\boldsymbol p_1, \boldsymbol p_2, \ldots, \boldsymbol p_n 线性无关,所以矩阵 P=(p1p2pn)P = \begin{pmatrix} \boldsymbol p_1 & \boldsymbol p_2 & \cdots & \boldsymbol p_n \end{pmatrix} 可逆
左乘 P1P^{-1},得到

P1AP=(λ1000λ2000λn)P^{-1} A P = \begin{pmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}

\square

  • 可以得到一个判定的充分条件是:矩阵的特征值互不相等

命题
nn 阶方阵 AA 的特征值为 λ1,λ2,,λk\lambda_1, \lambda_2, \ldots, \lambda_k,且均互不相等
则对应于每个特征值的特征向量组 p1,p2,,pk\boldsymbol p_1, \boldsymbol p_2, \ldots, \boldsymbol p_k 线性无关

证明

pi\boldsymbol p_i 为特征值 λi\lambda_i 对应的特征向量
基于归纳法证明它们线性无关

k=1k = 1 时,显然 p1\boldsymbol p_1 非零,所以线性无关
假设当 k=mk = m 时结论成立,考虑 k=m+1k = m + 1 的情况
设存在系数 c1,c2,,cm+1c_1, c_2, \ldots, c_{m+1},使得

c1p1+c2p2++cm+1pm+1=0c_1 \boldsymbol p_1 + c_2 \boldsymbol p_2 + \cdots + c_{m+1} \boldsymbol p_{m+1} = \boldsymbol 0

两边同时左乘 AA,得到

c1λ1p1+c2λ2p2++cm+1λm+1pm+1=0c_1 \lambda_1 \boldsymbol p_1 + c_2 \lambda_2 \boldsymbol p_2 + \cdots + c_{m+1} \lambda_{m+1} \boldsymbol p_{m+1} = \boldsymbol 0

将第一式乘以 λm+1\lambda_{m+1} 并与第二式相减,得到

c1(λ1λm+1)p1+c2(λ2λm+1)p2++cm(λmλm+1)pm=0c_1 (\lambda_1 - \lambda_{m+1}) \boldsymbol p_1 + c_2 (\lambda_2 - \lambda_{m+1}) \boldsymbol p_2 + \cdots + c_m (\lambda_m - \lambda_{m+1}) \boldsymbol p_m = \boldsymbol 0

根据归纳假设可知,p1,p2,,pm\boldsymbol p_1, \boldsymbol p_2, \ldots, \boldsymbol p_m 线性无关,所以

ci(λiλm+1)=0,i=1,2,,mc_i (\lambda_i - \lambda_{m+1}) = 0, \quad i = 1, 2, \ldots, m

由于 λiλm+1\lambda_i \neq \lambda_{m+1},所以 ci=0c_i = 0,代入第一式可知 cm+1=0c_{m+1} = 0
由此,p1,p2,,pm+1\boldsymbol p_1, \boldsymbol p_2, \ldots, \boldsymbol p_{m+1} 线性无关
\square

综上,对矩阵 AA 进行对角化的步骤为:

  • 求解矩阵的特征值
  • 求解每个特征值对应的特征向量
  • 判断矩阵是否可以对角化(存在 nn 个相异特征值 / 存在 nn 个线性无关的特征向量 / 特征空间维数之和为 nn
  • 拼接特征向量构成矩阵 PP,计算 P1APP^{-1} A P 即为对角化形式

示例
判断矩阵

A=(2633536127)A = \begin{pmatrix} -2 & 6 & 3 \\ 3 & -5 & -3 \\ -6 & 12 & 7 \end{pmatrix}

是否可对角化,若可对角化,求出其对角化形式

计算特征多项式

FA(λ)=det(λEA)=λ+2633λ+53612λ7=(λ+2)(λ1)2\begin{aligned} F_A(\lambda) &= \det(\lambda E - A) \\ &= \begin{vmatrix} \lambda + 2 & -6 & -3 \\ -3 & \lambda + 5 & 3 \\ 6 & -12 & \lambda - 7 \end{vmatrix} \\ &= (\lambda + 2) (\lambda - 1)^2 \end{aligned}

解出特征值为 λ1=2\lambda_1 = -2λ2=1\lambda_2 = 1(重根)

  • 对于 λ1=2\lambda_1 = -2,解方程组

(0633736129)(x1x2x3)=(000)\begin{pmatrix}0 & -6 & -3 \\ -3 & 7 & 3 \\ 6 & -12 & -9 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}

得到

x=t(100),tR\boldsymbol x = t \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \quad t \in \mathbb R

  • 对于 λ2=1\lambda_2 = 1,解方程组

(3633636128)(x1x2x3)=(000)\begin{pmatrix} 3 & -6 & -3 \\ -3 & 6 & 3 \\ 6 & -12 & -8 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}

得到

x=s(210)+r(101),s,rR\boldsymbol x = s \begin{pmatrix} 2 \\ 1 \\ 0 \end{pmatrix} + r \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}, \quad s, r \in \mathbb R

所以总共得到 3 个线性无关的特征向量,这意味着矩阵 AA 可对角化

p1=(100),p2=(210),p3=(101)\boldsymbol p_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \quad \boldsymbol p_2 = \begin{pmatrix} 2 \\ 1 \\ 0 \end{pmatrix}, \quad \boldsymbol p_3 = \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix}

构成矩阵

P=(121010001)P = \begin{pmatrix} 1 & 2 & 1 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

所以

P1AP=(200010001)P^{-1} A P = \begin{pmatrix} -2 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

\square

# 特征空间

依据特征值的定义

Ax=λxA \boldsymbol x = \lambda \boldsymbol x

可以求解出对应于每一个特征值的特征向量 x\boldsymbol x。该线性方程组可以写为

(AλI)x=0(A - \lambda I) \boldsymbol x = \boldsymbol 0

称每个解空间为每个特征值对应的 特征子空间 (Eigenspace)「固有部分空間」,记作 VλV_\lambda,即

Vλ={xKn(AλI)x=0}V_\lambda = \{\boldsymbol x \in K^n \mid (A - \lambda I) \boldsymbol x = \boldsymbol 0\}

  • 继承于解空间的性质,其维度可以由 dimVλ=nrank(AλI)\dim V_\lambda = n - \text{rank}(A - \lambda I) 计算得到
  • 由于 x\boldsymbol x 必须为非零向量,所以解出来的解空间必然至少为一维

特征空间对于原矩阵来说是一个非常重要的空间
如果将矩阵视为线性映射,那么特征空间就是一个非常特殊的区域,使得原映射在该区域内的所有向量都仅仅被伸缩,而不会被旋转或者发生其他变化

现在整理上述概念,可以得到:

  • 通过特征空间等概念,可以将原本矩阵所蕴含的信息,转换分解为,在各个特征空间中蕴含的信息
  • 研究原矩阵得以转为研究各个特征空间中的表现,这等价于:矩阵对于各个特征向量究竟产生了什么影响

命题
nn 阶方阵 AA 具有 rr 个互不相等的特征值 λ1,λ2,,λr\lambda_1, \lambda_2, \ldots, \lambda_r
AA 可对角化的充分必要条件为

i=1rdimVλi=n\sum_{i=1}^r \dim V_{\lambda_i} = n

证明

注意可对角化等价于存在 nn 个线性无关的特征向量
设每个特征值 λi\lambda_i 对应的特征空间 VλiV_{\lambda_i} 的维度为 did_i,则每个特征空间中均存在 did_i 个线性无关的特征向量
由于不同特征值对应的特征向量线性无关(参考上述命题),所以总共存在

i=1rdi\sum_{i=1}^r d_i

个线性无关的特征向量
所以矩阵 AA 可对角化的充分必要条件为

i=1rdi=n\sum_{i=1}^r d_i = n

\square

回忆子空间的直和,有在 V=W1+W2V = W_1 + W_2

V=W1W2dimV=dimW1+dimW2V = W_1 \oplus W_2 \iff \dim V = \dim W_1 + \dim W_2

所以,这也可以得到矩阵可对角化的另一个等价条件

命题
nn 阶方阵 AA 具有 rr 个互不相等的特征值 λ1,λ2,,λr\lambda_1, \lambda_2, \ldots, \lambda_r
AA 可对角化的充分必要条件为

V=Vλ1Vλ2VλrV = V_{\lambda_1} \oplus V_{\lambda_2} \oplus \cdots \oplus V_{\lambda_r}

证明

(\Rightarrow)
根据上述命题,矩阵 AA 可对角化等价于

i=1rdimVλi=n\sum_{i=1}^r \dim V_{\lambda_i} = n

由于各个特征空间中的特征向量线性无关,并且一共存在 nn 个线性无关的特征向量,所以

V=Vλ1+Vλ2++VλrV = V_{\lambda_1} + V_{\lambda_2} + \cdots + V_{\lambda_r}

所以

V=Vλ1Vλ2VλrV = V_{\lambda_1} \oplus V_{\lambda_2} \oplus \cdots \oplus V_{\lambda_r}

(\Leftarrow)
根据直和的定义可知

dimV=i=1rdimVλi=n\dim V = \sum_{i=1}^r \dim V_{\lambda_i} = n

所以矩阵 AA 可对角化
\square

  • 这是利用特征空间对线性空间进行的直和分解

# Cayley-Hamilton 定理

利用特征方程,除了可以解出特征值,还可以方便地计算矩阵的多项式

定理 Cayley-Hamilton 定理
AAnn 阶方阵,FA(λ)F_A(\lambda) 为其特征多项式,则

FA(A)=OF_A(A) = O

证明

设矩阵

B=t(xEA)B = {}^t(xE - A)

这是各个元素均为 xx 的多项式的矩阵,且

detB=FA(x)\det B = F_A(x)

B~\widetilde B为矩阵 BB 的余子矩阵,则有

B~B=FA(x)En\widetilde B B = F_A(x) E_n

B(A)B(A) 为将矩阵 AA 代入矩阵 BB 中的结果,则

B(A)=(Aa11Ea21Ean1Ea12EAa22Ean2Ea1nEa2nEAannE)B(A) = \begin{pmatrix} A - a_{11} E & -a_{21} E & \cdots & -a_{n1} E \\ -a_{12} E & A - a_{22} E & \cdots & -a_{n2} E \\ \vdots & \vdots & \ddots & \vdots \\ -a_{1n} E & -a_{2n} E & \cdots & A - a_{nn} E \end{pmatrix}

用同样的方法定义 B~(A)\widetilde B(A),则矩阵积可以由分割表示为

B~(A)B(A)=(FA(A)OOOFA(A)OOOFA(A))\widetilde B(A) B(A) = \begin{pmatrix} F_A(A) & O & \cdots & O \\ O & F_A(A) & \cdots & O \\ \vdots & \vdots & \ddots & \vdots \\ O & O & \cdots & F_A(A) \end{pmatrix}

将等式两边乘以 Rn\mathbb R^n 的标准正交归一基,得到

B~(A)B(A)(e1e2en)=(FA(A)e1FA(A)e2FA(A)en)\widetilde B(A) B(A) \begin{pmatrix} \boldsymbol e_1 \\ \boldsymbol e_2 \\ \vdots \\ \boldsymbol e_n \end{pmatrix} = \begin{pmatrix} F_A(A) \boldsymbol e_1 \\ F_A(A) \boldsymbol e_2 \\ \vdots \\ F_A(A) \boldsymbol e_n \end{pmatrix}

另一边,单独对 B(A)B(A) 作用在 ei\boldsymbol e_i 上,得到

B(A)(e1e2en)=(=(Aa11E)e1a21Ee2an1Eena12Ee1+(Aa22E)e2an2Eena1nEe1a2nEe2+(AannE)en)=(000)B(A) \begin{pmatrix} \boldsymbol e_1 \\ \boldsymbol e_2 \\ \vdots \\ \boldsymbol e_n \end{pmatrix} = \begin{pmatrix} =(A - a_{11} E) \boldsymbol e_1 - a_{21} E \boldsymbol e_2 - \cdots - a_{n1} E \boldsymbol e_n \\ -a_{12} E \boldsymbol e_1 + (A - a_{22} E) \boldsymbol e_2 - \cdots - a_{n2} E \boldsymbol e_n \\ \vdots \\ -a_{1n} E \boldsymbol e_1 - a_{2n} E \boldsymbol e_2 - \cdots + (A - a_{nn} E) \boldsymbol e_n \end{pmatrix} = \begin{pmatrix} \boldsymbol 0 \\ \boldsymbol 0 \\ \vdots \\ \boldsymbol 0 \end{pmatrix}

所以

FA(A)ei=0,i=1,2,,nF_A(A) \boldsymbol e_i = \boldsymbol 0, \quad i = 1, 2, \ldots, n

这等价于 FA(A)=OF_A(A) = O
\square

以下是应用示例。本质上是对多项式的降次

示例
令矩阵

A=(2301)A = \begin{pmatrix} 2 & 3 \\ 0 & -1 \end{pmatrix}

  • A4A^4
  • A73A4A^7 - 3A^4

计算特征多项式

FA(λ)=det(λEA)=λ230λ+1=(λ2)(λ+1)\begin{aligned} F_A(\lambda) &= \det(\lambda E - A) \\ &= \begin{vmatrix} \lambda - 2 & -3 \\ 0 & \lambda + 1 \end{vmatrix} \\ &= (\lambda - 2)(\lambda + 1) \end{aligned}

由 Cayley-Hamilton 定理可知

FA(A)=(A2E)(A+E)=A2A2E=OF_A(A) = (A - 2E)(A + E) = A^2 - A - 2E = O

所以

A2=A+2EA^2 = A + 2E

接下来,计算 A4A^4

A4=(A2)2=(A+2E)2=A2+4A+4E=(A+2E)+4A+4E=5A+6E=(281504)\begin{aligned} A^4 &= (A^2)^2 \\ &= (A + 2E)^2 \\ &= A^2 + 4A + 4E \\ &= (A + 2E) + 4A + 4E \\ &= 5A + 6E \\ &= \begin{pmatrix} 28 & 15 \\ 0 & 4 \end{pmatrix} \end{aligned}

计算 A73A4A^7 - 3A^4

A73A4=A3A43A4=A3(5A+6E)3(5A+6E)=5A4+6A315A18E=5(5A+6E)+6A315A18E=10A+12E+6A3=28A+24E=(9687036)\begin{aligned} A^7 - 3A^4 &= A^3 A^4 - 3A^4 \\ &= A^3 (5A + 6E) - 3(5A + 6E) \\ &= 5A^4 + 6A^3 - 15A - 18E \\ &= 5(5A + 6E) + 6A^3 - 15A - 18E \\ &= 10A + 12E + 6A^3 \\ &= 28A + 24E \\ &= \begin{pmatrix} 96 & 87 \\ 0 & 36 \end{pmatrix} \end{aligned}

\square

# 线性变换的对角化

由于一个矩阵所蕴含的信息等价于一个线性映射所表述的信息。所以对角化实际上也可以对线性映射进行执行。这样做的结果是可以得到更加漂亮的矩阵表示

示例
V=R[x]2V = \mathbb R[x]_2
定义线性变换

f:VV,g(x)g(1x)f: V \to V, \quad g(x) \mapsto g(1-x)

求该线性映射在对角化下的新矩阵表示

首先,取 VV 的标准基底

E=(1,x,x2)\mathscr E = (1, x, x^2)

计算线性映射在该基底下的矩阵表示

f(1)=1f(x)=1xf(x2)=(1x)2=12x+x2\begin{aligned} f(1) &= 1 \\ f(x) &= 1 - x \\ f(x^2) &= (1 - x)^2 = 1 - 2x + x^2 \end{aligned}

所以矩阵表示为

A=(111012001)A = \begin{pmatrix} 1 & 1 & 1 \\ 0 & -1 & -2 \\ 0 & 0 & 1 \end{pmatrix}

计算特征多项式

FA(λ)=det(AλI)=(1λ)2(1λ)F_A(\lambda) = \det(A - \lambda I) = (1 - \lambda)^2 (-1 - \lambda)

解出特征值为 λ1=1\lambda_1 = 1(重根),λ2=1\lambda_2 = -1
接下来,求解特征值对应的特征向量

  • 对于 λ1=1\lambda_1 = 1,解方程组

(011022000)(x1x2x3)=(000)\begin{pmatrix} 0 & 1 & 1 \\ 0 & -2 & -2 \\ 0 & 0 & 0 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}

得到

x=s(100)+t(011),s,tR\boldsymbol x = s \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} + t \begin{pmatrix} 0 \\ -1 \\ 1 \end{pmatrix}, \quad s, t \in \mathbb R

  • 对于 λ2=1\lambda_2 = -1,解方程组

(211002002)(x1x2x3)=(000)\begin{pmatrix} 2 & 1 & 1 \\ 0 & 0 & -2 \\ 0 & 0 & 2 \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \\ 0 \end{pmatrix}

得到

x=r(1210),rR\boldsymbol x = r \begin{pmatrix} \frac{1}{2} \\ 1 \\ 0 \end{pmatrix}, \quad r \in \mathbb R

所以总共得到 3 个线性无关的特征向量

p1=(100),p2=(011),p3=(1210)\boldsymbol p_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \quad \boldsymbol p_2 = \begin{pmatrix} 0 \\ -1 \\ 1 \end{pmatrix}, \quad \boldsymbol p_3 = \begin{pmatrix} \frac{1}{2} \\ 1 \\ 0 \end{pmatrix}

构成矩阵

P=(1012011010)P = \begin{pmatrix} 1 & 0 & \frac{1}{2} \\ 0 & -1 & 1 \\ 0 & 1 & 0 \end{pmatrix}

此时,矩阵 AA 可对角化,且对角化后的矩阵为

P1AP=(100010001)P^{-1} A P = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -1 \end{pmatrix}