对角化非常强大,它可以抽取出线性映射中最漂亮的基,洞察空间的真实结构
但是对角化具有非常多的限制条件,例如现在已知对于 nn 阶方阵来说

  • 需要有 nn 个线性无关的特征向量才可以对角化
  • 需要是实对称矩阵才可以通过正交矩阵对角化
  • 需要是 Hermitian 矩阵才可以通过酉矩阵对角化

那么有没有某一种变化,它的功效稍微低一些,但是可以对任意方阵执行呢?

定理 上三角化定理
AAF\mathbb F 上的 nn 阶方阵,且 λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_nAAF\mathbb F 上的全部特征值(重根按重数计算)
此时,存在正则矩阵 PP,使得

P1AP=(λ10λ200λ3000λn)P^{-1} A P = \begin{pmatrix} \lambda_1 & * & * & \cdots & * \\ 0 & \lambda_2 & * & \cdots & * \\ 0 & 0 & \lambda_3 & \cdots & * \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda_n \end{pmatrix}

证明

利用数学归纳法证明该结论
n=1n = 1 时,结论显然成立

假设当矩阵阶数为 kk 时结论成立,现考虑 k+1k + 1 阶矩阵 AA
由于 F\mathbb FAA 存在特征值 λ1\lambda_1,取对应的特征向量 v1\boldsymbol v_1,并将其扩展为 k+1k + 1 维空间的基底

(v1v2vk+1)\begin{pmatrix} \boldsymbol v_1 & \boldsymbol v_2 & \cdots & \boldsymbol v_{k+1} \end{pmatrix}

在该基底下,线性变换 TAT_A 的矩阵表示为

[TA]B=(λ100A0)[T_A]_{\mathcal B} = \begin{pmatrix} \lambda_1 & * & * & \cdots & * \\ 0 & & & & \\ 0 & & A' & & \\ \vdots & & & & \\ 0 & & & & \end{pmatrix}

其中 AA'kk 阶矩阵,且 AA'F\mathbb F 上的全部特征值为 λ2,λ3,,λk+1\lambda_2, \lambda_3, \ldots, \lambda_{k+1}
根据归纳假设,存在正则矩阵 QQ,使得

Q1AQ=(λ20λ300λ4000λk+1)Q^{-1} A' Q = \begin{pmatrix} \lambda_2 & * & * & \cdots & * \\ 0 & \lambda_3 & * & \cdots & * \\ 0 & 0 & \lambda_4 & \cdots & * \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda_{k+1} \end{pmatrix}

P=(100000Q0)P = \begin{pmatrix} 1 & 0 & 0 & \cdots & 0 \\ 0 & & & & \\ 0 & & Q & & \\ \vdots & & & & \\ 0 & & & & \end{pmatrix}

P1AP=(λ10λ200λ3000λk+1)P^{-1} A P = \begin{pmatrix} \lambda_1 & * & * & \cdots & * \\ 0 & \lambda_2 & * & \cdots & * \\ 0 & 0 & \lambda_3 & \cdots & * \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \lambda_{k+1} \end{pmatrix}

因此结论对 k+1k + 1 阶矩阵亦成立,归纳完毕。
\square

可以看出,上三角化并没有对角化那么漂亮,最根本的原因在于这不是唯一的。上三角化得到的矩阵中有多个不唯一的元素
所以,尽可能的在上三角化中,选取某一类固定的,漂亮的矩阵作为唯一分解结果,这样一来对任意矩阵都可以得到一个上三角的标准形式

# 广义特征空间

在经过对角化的学习后,应该要能看出对角化的本质是对线性空间执行的直和分解。分解的基本单位是特征空间。
而只有在特征空间的维数和等于该空间的维数时,这个分解才可以执行。为了找到一般矩阵的 “对角化”,首先需要克服的问题就是直和分解
作为代替,我们来证明 Fn\mathbb F^n 时常可以被分解为广义特征空间的直和

  • 不要忘记之前的结论:任意一个定义在 F\mathbb F 上的 nn 维线性空间 VVFn\mathbb F^n 同构

定义
VVnn 维线性空间,f:VVf: V \to V 为线性变换,λF\lambda \in \mathbb Fff 的特征值
定义 VV 上的线性变换

φλ:=fλidV:VV\varphi_\lambda := f - \lambda \mathrm{id}_V: V \to V

W~:={vVφλn(v)=0}\widetilde W := \{\boldsymbol v \in V \mid \varphi_\lambda^n(\boldsymbol v) = \boldsymbol 0\}

为线性变换 ff 关于特征值 λ\lambda广义特征空间 (Generalized Eigenspace)「広義固有空間」

  • 本质上可以看出 W~=Ker(φλn)\widetilde W = \mathrm{Ker}(\varphi_\lambda^n),所以 W~\widetilde W 确实是 VV 的子空间

如果对原本的线性变换进行限制,即

fW~:W~W~f|_{\widetilde W}: \widetilde W \to \widetilde W

那么因为

(φλf)(v)=f(f(v))λf(v)=f(f(v))f(λv)=(fφλ)(v)\begin{aligned} (\varphi_\lambda \circ f)(\boldsymbol v) &= f(f(\boldsymbol v)) - \lambda f(\boldsymbol v) \\ &= f(f(\boldsymbol v)) - f(\lambda \boldsymbol v) \\ &= (f \circ \varphi_\lambda)(\boldsymbol v) \end{aligned}

注意到 φλn(v)=0\varphi_\lambda^n(\boldsymbol v) = \boldsymbol 0,所以

φλnf=fφλn\varphi_\lambda^n \circ f = f \circ \varphi_\lambda^n

那么

(φλnf)(v)=(fφλn)(v)=f(0)=0(\varphi_\lambda^n \circ f)(\boldsymbol v) = (f \circ \varphi_\lambda^n)(\boldsymbol v) = f(\boldsymbol 0) = \boldsymbol 0

这意味着 f(v)W~f(\boldsymbol v) \in \widetilde W,也就是说 fW~f|_{\widetilde W} 也是 W~\widetilde W 上的线性变换


在执行广义特征空间的直和分解之前,首先需要确定其直和结构

命题
λ1,λ2,,λk\lambda_1, \lambda_2, \ldots, \lambda_k 为线性变换 f:VVf: V \to VF\mathbb F 上的全部不同特征值,则

W~λ1+W~λ2++W~λk=W~λ1W~λ2W~λk\widetilde W_{\lambda_1} + \widetilde W_{\lambda_2} + \cdots + \widetilde W_{\lambda_k} = \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_k}

证明

基于归纳法证明
k=1k = 1 时,结论显然成立
假设当 k=mk = m 时结论成立,现考虑 k=m+1k = m + 1 的情形
取任意 vW~λ1+W~λ2++W~λm+1\boldsymbol v \in \widetilde W_{\lambda_1} + \widetilde W_{\lambda_2} + \cdots + \widetilde W_{\lambda_{m+1}},则存在 viW~λi\boldsymbol v_i \in \widetilde W_{\lambda_i},使得

v=i=1m+1vi\boldsymbol v = \sum_{i=1}^{m+1} \boldsymbol v_i

应用归纳假设,有

i=1mvi=w1+w2\sum_{i=1}^m \boldsymbol v_i = \boldsymbol w_1 + \boldsymbol w_2

其中 w1W~λ1W~λ2W~λm\boldsymbol w_1 \in \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_m}w2W~λm+1\boldsymbol w_2 \in \widetilde W_{\lambda_{m+1}}
所以

v=w1+(w2+vm+1)\boldsymbol v = \boldsymbol w_1 + (\boldsymbol w_2 + \boldsymbol v_{m+1})

注意到 W~λm+1\widetilde W_{\lambda_{m+1}} 为子空间,所以 w2+vm+1W~λm+1\boldsymbol w_2 + \boldsymbol v_{m+1} \in \widetilde W_{\lambda_{m+1}},因此

vW~λ1W~λ2W~λm+1\boldsymbol v \in \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_{m+1}}

反之亦然,所以

W~λ1+W~λ2++W~λm+1=W~λ1W~λ2W~λm+1\widetilde W_{\lambda_1} + \widetilde W_{\lambda_2} + \cdots + \widetilde W_{\lambda_{m+1}} = \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_{m+1}}

\square

定理 ** 广义特征空间直和分解
VVF\mathbb F 上的 nn 维线性空间,f:VVf: V \to V 为线性变换,设 ff 的特征多项式形如

Ff(λ)=(λλ1)n1(λλ2)n2(λλk)nkF_f(\lambda) = (\lambda - \lambda_1)^{n_1} (\lambda - \lambda_2)^{n_2} \cdots (\lambda - \lambda_k)^{n_k}

V=W~λ1W~λ2W~λkV = \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_k}

其中

dimW~λi=ni\dim \widetilde W_{\lambda_i} = n_i

证明

1ik1 \leq i \leq k,令

gi(λ)=FA(λ)(λλi)nig_i(\lambda) = \frac{F_A(\lambda)}{(\lambda - \lambda_i)^{n_i}}

由 Cayley–Hamilton 定理,得到对于任意 vV\boldsymbol v \in V,有

FA(A)v=(AλiE)nigi(A)v=0F_A(A) \boldsymbol v = (A - \lambda_i E)^{n_i} g_i(A) \boldsymbol v = \boldsymbol 0

所以 g_i(A) \boldsymbol v \in \widetilde W_

取任意 vV\boldsymbol v \in V,则存在多项式 hi(λ)h_i(\lambda),使得

i=1khi(λ)gi(λ)=1\sum_{i=1}^k h_i(\lambda) g_i(\lambda) = 1

因此

v=i=1khi(A)gi(A)v\boldsymbol v = \sum_{i=1}^k h_i(A) g_i(A) \boldsymbol v

注意到 gi(A)vW~λig_i(A) \boldsymbol v \in \widetilde W_{\lambda_i},所以 vi=1kW~λi\boldsymbol v \in \sum_{i=1}^k \widetilde W_{\lambda_i},从而

V=i=1kW~λi=W~λ1W~λ2W~λkV = \sum_{i=1}^k \widetilde W_{\lambda_i} = \widetilde W_{\lambda_1} \oplus \widetilde W_{\lambda_2} \oplus \cdots \oplus \widetilde W_{\lambda_k}

接下来证明 dimW~λi=ni\dim \widetilde W_{\lambda_i} = n_i
W~λi\widetilde W_{\lambda_i} 上的任意基

(w1iw2iwmii)\begin{pmatrix} \boldsymbol w^i_1 & \boldsymbol w^i_2 & \cdots & \boldsymbol w^i_{m_i'} \end{pmatrix}

通过对 1ik1 \leq i \leq k 进行排列,可以得到 VV 上的基
使用这个基下,线性变换 ff 的矩阵表示为

[f]B=(A10000A20000A30000Ak)[f]_{\mathcal B} = \begin{pmatrix} A_1 & 0 & 0 & \cdots & 0 \\ 0 & A_2 & 0 & \cdots & 0 \\ 0 & 0 & A_3 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & A_k \end{pmatrix}

其中各个 AiA_iW~λi\widetilde W_{\lambda_i} 上的线性变换 fW~λif|_{\widetilde W_{\lambda_i}} 的矩阵表示
由于每个 AiA_i 的特征多项式均为 (λλi)mi(\lambda - \lambda_i)^{m_i'},所以

FA(λ)=i=1k(λλi)miF_A(\lambda) = \prod_{i=1}^k (\lambda - \lambda_i)^{m_i'}

又由于特征多项式的唯一性,得到 mi=nim_i' = n_i,从而 dimW~λi=ni\dim \widetilde W_{\lambda_i} = n_i
\square

# Jordan 标准化

完成了直和分解的理论结构后,就可以进行对变换的构造了

定义
对于任意的数 λF\lambda \in \mathbb F,以及正整数 nNn \in \mathbb N,称 nn 阶矩阵

Jn(λ)=(λ1000λ1000λ00001000λ)J_n(\lambda) = \begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ 0 & 0 & \lambda & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & \lambda \end{pmatrix}

Jordan 块 (Jordan Block)「ジョルダン細胞」

将多个 Jordan 块沿对角线排列起来,就可以得到 Jordan 矩阵 (Jordan Matrix)「ジョルダン行列」

J=(Jn1(λ1)0000Jn2(λ2)0000Jn3(λ3)0000Jnk(λk))J = \begin{pmatrix} J_{n_1}(\lambda_1) & 0 & 0 & \cdots & 0 \\ 0 & J_{n_2}(\lambda_2) & 0 & \cdots & 0 \\ 0 & 0 & J_{n_3}(\lambda_3) & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & J_{n_k}(\lambda_k) \end{pmatrix}

  • 该矩阵阶为 i=1kni\sum_{i=1}^k n_i

如果一个 Jordan 矩阵中,所有 Jordan 块的特征值均为相同的 λ\lambda,则称该 Jordan 矩阵为 λ\lambda-Jordan 矩阵,记为 JλJ_\lambda


VVF\mathbb F 上的 nn 维线性空间,f:VVf: V \to V 为线性变换,λ\lambdaff 的特征值
回忆到 fW~λf|_{\widetilde W_\lambda}W~λ\widetilde W_\lambda 上的线性变换,设其标准矩阵为 AλA_\lambda,设 dimW~λ=nλ\dim \widetilde W_\lambda = n_\lambda
φλ:=fW~λλidW~λ\varphi_\lambda := f|_{\widetilde W_\lambda} - \lambda \mathrm{id}_{\widetilde W_\lambda} 的标准矩阵为 NλN_\lambda
则特征空间满足

W~λ={vVNλnv=0}\widetilde W_\lambda = \{\boldsymbol v \in V \mid N_\lambda^n \boldsymbol v = \boldsymbol 0\}

vW~λ\boldsymbol v \in \widetilde W_\lambda,使得 Nλnλv=0N_\lambda^{n_\lambda} \boldsymbol v = \boldsymbol 0,构造向量组

(vNλvNλ2vNλnλ1v)\begin{pmatrix} \boldsymbol v & N_\lambda \boldsymbol v & N_\lambda^2 \boldsymbol v & \cdots & N_\lambda^{n_\lambda - 1} \boldsymbol v \end{pmatrix}

命题
若所有向量非零,则

N={v,Nλv,Nλ2v,,Nλnλ1v}\mathscr N = \{ \boldsymbol v, N_\lambda \boldsymbol v, N_\lambda^2 \boldsymbol v, \ldots, N_\lambda^{n_\lambda - 1} \boldsymbol v \}

构成 W~λ\widetilde W_\lambda 的基

证明

设存在系数 a0,a1,,anλ1Fa_0, a_1, \ldots, a_{n_\lambda - 1} \in \mathbb F,使得

a0v+a1Nλv+a2Nλ2v++anλ1Nλnλ1v=0a_0 \boldsymbol v + a_1 N_\lambda \boldsymbol v + a_2 N_\lambda^2 \boldsymbol v + \cdots + a_{n_\lambda - 1} N_\lambda^{n_\lambda - 1} \boldsymbol v = \boldsymbol 0

应用 Nλnλ1N_\lambda^{n_\lambda - 1} 于上式,得到

a0Nλnλ1v=0a_0 N_\lambda^{n_\lambda - 1} \boldsymbol v = \boldsymbol 0

由于 Nλnλ1v0N_\lambda^{n_\lambda - 1} \boldsymbol v \neq \boldsymbol 0,所以 a0=0a_0 = 0
类似地,依次应用 Nλnλ2,Nλnλ3,,Nλ0N_\lambda^{n_\lambda - 2}, N_\lambda^{n_\lambda - 3}, \ldots, N_\lambda^0,可以得到 a1=a2==anλ1=0a_1 = a_2 = \cdots = a_{n_\lambda - 1} = 0
因此,向量组 N\mathscr N 线性无关

又由于 W~λ\widetilde W_\lambda 的维数为 nλn_\lambda,所以 N\mathscr N 构成 W~λ\widetilde W_\lambda 的基
\square

不妨假设上述向量组中的所有向量均非零,那么就可以构造出 W~λ\widetilde W_\lambda 的基 N\mathcal N

符号上,令

{e1:=ve2:=Nλve3:=Nλ2venλ:=Nλnλ1v\begin{cases} \boldsymbol e_1 := \boldsymbol v \\ \boldsymbol e_2 := N_\lambda \boldsymbol v \\ \boldsymbol e_3 := N_\lambda^2 \boldsymbol v \\ \vdots \\ \boldsymbol e_{n_\lambda} := N_\lambda^{n_\lambda - 1} \boldsymbol v \end{cases}

显然,此时具有映射关系链

enλNλenλ1Nλenλ2NλNλe2Nλe1Nλ0e_{n_\lambda} \xrightarrow{N_\lambda} e_{n_\lambda - 1} \xrightarrow{N_\lambda} e_{n_\lambda - 2} \xrightarrow{N_\lambda} \cdots \xrightarrow{N_\lambda} e_2 \xrightarrow{N_\lambda} e_1 \xrightarrow{N_\lambda} 0

回看矩阵 AλA_\lambda 在基底 N\mathcal N 下的表现:

Ae1=λe1Ae2=e1+λe2Ae3=e2+λe3Aenλ=enλ1+λenλ\begin{aligned} A \boldsymbol e_1 &= \lambda \boldsymbol e_1 \\ A \boldsymbol e_2 &= \boldsymbol e_1 + \lambda \boldsymbol e_2 \\ A \boldsymbol e_3 &= \boldsymbol e_2 + \lambda \boldsymbol e_3 \\ &\vdots \\ A \boldsymbol e_{n_\lambda} &= \boldsymbol e_{n_\lambda - 1} + \lambda \boldsymbol e_{n_\lambda} \end{aligned}

因此,矩阵 AλA_\lambda 在基底 N\mathcal N 下的矩阵表示为

(vNλvNλnλ1v)1Aλ(vNλvNλnλ1v)=(λ1000λ1000λ00001000λ)\begin{pmatrix} \boldsymbol v & N_\lambda \boldsymbol v & \cdots & N_\lambda^{n_\lambda - 1} \boldsymbol v \end{pmatrix}^{-1} A_\lambda \begin{pmatrix} \boldsymbol v & N_\lambda \boldsymbol v & \cdots & N_\lambda^{n_\lambda - 1} \boldsymbol v \end{pmatrix} = \begin{pmatrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ 0 & 0 & \lambda & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & \lambda \end{pmatrix}

这正是我们想要寻找的 Jordan 矩阵。
对每一个特征值 λi\lambda_i,都可以通过类似的方式构造出 W~λi\widetilde W_{\lambda_i} 上的 Jordan 矩阵 JλiJ_{\lambda_i}
再通过广义特征空间的直和分解,就可以得到整个空间 VV 上的 Jordan 矩阵表示

定理 Jordan 标准型定理
对于任意 nn 阶方阵 AA,令其特征多项式为

FA(λ)=(λλ1)n1(λλ2)n2(λλk)nkF_A(\lambda) = (\lambda - \lambda_1)^{n_1} (\lambda - \lambda_2)^{n_2} \cdots (\lambda - \lambda_k)^{n_k}

则存在正则矩阵 PP,使得

P1AP=(J10000J20000J30000Jk)P^{-1} A P = \begin{pmatrix} J_1 & 0 & 0 & \cdots & 0 \\ 0 & J_2 & 0 & \cdots & 0 \\ 0 & 0 & J_3 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & J_k \end{pmatrix}

其中,各个 JiJ_i 为 Jordan 矩阵

Ji=(Jλi(1i)0000Jλi(2i)0000Jλi(3i)0000Jλi(mii)),j=1niji=niJ_i = \begin{pmatrix} J_{\lambda_i}(\ell_1^i) & 0 & 0 & \cdots & 0 \\ 0 & J_{\lambda_i}(\ell_2^i) & 0 & \cdots & 0 \\ 0 & 0 & J_{\lambda_i}(\ell_3^i) & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & J_{\lambda_i}(\ell_{m_i}^i) \end{pmatrix},\qquad \sum_{j=1}^{n_i} \ell_j^i = n_i

该分解在 Jordan 块的排列顺序上唯一

证明

暂时省略,不妨参考 www.chart.co.jp 官网给出的说明

由此,求解矩阵的 Jordan 标准化的流程为

  • 计算矩阵的特征多项式,并分解出全部特征值及其重数
  • 对于每一个特征值 λi\lambda_i,计算各个 (AλiI)p(A - \lambda_i I)^p 的秩,从而计算出各个阶数的 Jordan 块数量
  • 将各个 Jordan 块沿对角线排列起来,得到 Jordan 矩阵
  • 计算出相应的相似变换矩阵 PP,从而完成 Jordan 标准化

示例
计算矩阵

A=(672562791)A = \begin{pmatrix} -6 & -7 & 2 \\ 5 & 6 & -2 \\ -7 & -9 & 1 \end{pmatrix}

的 Jordan 标准型。

首先,计算矩阵 AA 的特征多项式

FA(λ)=det(λEA)=λ+6725λ6279λ1=(λ+1)2(λ3)\begin{aligned} F_A(\lambda) &= \det(\lambda E - A) \\ &= \begin{vmatrix} \lambda + 6 & 7 & -2 \\ -5 & \lambda - 6 & 2 \\ 7 & 9 & \lambda - 1 \end{vmatrix} \\ &= (\lambda + 1 )^2 (\lambda - 3) \end{aligned}

因此,根据特征根的重数

dimW~1=2,dimW~3=1\dim \widetilde W_{-1} = 2, \quad \dim \widetilde W_{3} = 1

(1) 对于特征值 λ1=3\lambda_1 = 3,解方程 (A3E)x=0(A - 3E) \boldsymbol x = \boldsymbol 0,得到特征向量,同时也是 W~3\widetilde W_3 的基

v1=(111)\boldsymbol v_1 = \begin{pmatrix} 1 \\ -1 \\ 1 \end{pmatrix}

(2) 对于特征值 λ2=1\lambda_2 = -1,注意该空间维度为 22,所以需要解出满足 (A+E)2x=0(A + E)^2 \boldsymbol x = \boldsymbol 0 的向量,得到

v2=(430),v3=(103)\boldsymbol v_2 = \begin{pmatrix} -4 \\ 3 \\ 0 \end{pmatrix}, \quad \boldsymbol v_3 = \begin{pmatrix} 1 \\ 0 \\ 3 \end{pmatrix}

构造 W~1\widetilde W_{-1} 的基,其中 v3=(A+E)v2\boldsymbol v_3 = (A + E) \boldsymbol v_2

(v2v3)=((430)(111))\begin{pmatrix} \boldsymbol v_2 & \boldsymbol v_3 \end{pmatrix} = \begin{pmatrix} \begin{pmatrix} -4 \\ 3 \\ 0 \end{pmatrix} & \begin{pmatrix} -1 \\ 1 \\ 1 \end{pmatrix} \end{pmatrix}

计算各个基向量在 AA 下的映射

Av1=3v1Av2=v2Av3=v2v3\begin{aligned} A \boldsymbol v_1 &= 3 \boldsymbol v_1 \\ A \boldsymbol v_2 &= -\boldsymbol v_2 \\ A \boldsymbol v_3 &= \boldsymbol v_2 - \boldsymbol v_3 \end{aligned}

构造相似变换矩阵

P=(v2v3v1)=(411311011)P = \begin{pmatrix} \boldsymbol v_2 & \boldsymbol v_3 & \boldsymbol v_1 \end{pmatrix} = \begin{pmatrix} -4 & -1 & 1 \\ 3 & 1 & -1 \\ 0 & 1 & 1 \end{pmatrix}

因此,

P1AP=(300011001)P^{-1} A P = \begin{pmatrix} 3 & 0 & 0 \\ 0 & -1 & 1 \\ 0 & 0 & -1 \end{pmatrix}

\square