通过线性变换的对角化,哪怕是对于一些看似非线性代数的问题,只要能按照以下流程,都可以被解决

  • 构造出线性空间
  • 找到某种条件对应的线性变换
  • 通过对角化,用新的语言描述这一条件
  • 回推到原问题中给出结果

# 线性递推数列

V=RNV = \mathbb R^\mathbb N,即所有实数数列
其中的元(数列)可以表示为(同时也可以作为列向量)

a={an}nN=(a1,a2,a3,)\boldsymbol a = \{a_n\}_{n \in \mathbb N} = (a_1, a_2, a_3, \ldots)

不难验证,对于任意两个元 a,bV\boldsymbol a, \boldsymbol b \in V,以及任意数 kRk \in \mathbb R

  • 加法 a+b:={an+bn}nN\boldsymbol a + \boldsymbol b := \{a_n + b_n\}_{n \in \mathbb N} \quad
  • 数乘 ka:={kan}nNk \boldsymbol a := \{k a_n\}_{n \in \mathbb N} \quad

都仍然属于 VV,并且满足线性空间的公理。所以 VV 是一个实线性空间

  • 零元定义为 0=(0,0,0,)\boldsymbol 0 = (0, 0, 0, \ldots)

任取实数 p,qRp,q \in \mathbb R。定义 VV 中拥有基于 p,qp,q 的线性递推式的数列全体

W:={aVan+2=pan+1+qan,nN}W := \{\boldsymbol a \in V \mid a_{n+2} = p a_{n+1} + q a_n, \forall n \in \mathbb N\}

显然 0W\boldsymbol 0 \in W
任取 a,bW\boldsymbol a, \boldsymbol b \in W,则

an+2+bn+2=pan+1+qan+pbn+1+qbn=p(an+1+bn+1)+q(an+bn)kan+2=p(kan+1)+q(kan)\begin{aligned} a_{n+2} + b_{n+2} &= p a_{n+1} + q a_n + p b_{n+1} + q b_n \\ &= p (a_{n+1} + b_{n+1}) + q (a_n + b_n) \\ k a_{n+2} &= p (k a_{n+1}) + q (k a_n) \end{aligned}

所以 WW 在加法与数乘下封闭,成为 VV 的子空间

定义数列

{e1:=(1,0,q,pq,p2q+q2,)e2:=(0,1,p,p2+q,p3+2pq,)\begin{cases} \boldsymbol e_1 := (1, 0, q, pq, p^2 q + q^2, \ldots) \\ \boldsymbol e_2 := (0, 1, p, p^2 + q, p^3 + 2 p q, \ldots) \end{cases}

建立线性方程组

(e1e2)(c1c2)=0\begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} \begin{pmatrix} c_1 \\ c_2 \end{pmatrix} = \boldsymbol 0

整理等式

{c11+c20=0c10+c21=0c1q+c2p=0\begin{cases} c_1 \cdot 1 + c_2 \cdot 0 = 0 \\ c_1 \cdot 0 + c_2 \cdot 1 = 0 \\ c_1 \cdot q + c_2 \cdot p = 0 \\ \vdots \end{cases}

对比前两项不难看出,方程唯一解为 c1=c2=0c_1 = c_2 = 0,所以 e1,e2\boldsymbol e_1, \boldsymbol e_2 线性无关

任取元 wW\boldsymbol w \in W,注意前两项具有如下关系

(e1e2)(w1w2)=(w1w2)\begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} \begin{pmatrix} w_1 \\ w_2 \end{pmatrix} = \begin{pmatrix} w_1 \\ w_2 \end{pmatrix}

根据 WW 的定义,已知数列前两项后即可以唯一确定元 w\boldsymbol w 的所有项,所以

w=w1e1+w2e2\boldsymbol w = w_1 \boldsymbol e_1 + w_2 \boldsymbol e_2

因此 e1,e2\boldsymbol e_1, \boldsymbol e_2 张成 WW
综上所述,E=(e1e2)\mathscr E = \begin{pmatrix}\boldsymbol e_1 & \boldsymbol e_2\end{pmatrix} 构成 WW 的一组基底,且 dimW=2\dim W = 2

目前该基只反映了基础的递推关系,并没有提供额外信息。为了解决实际问题需要找到更漂亮的基,要求它可以反映出 WW 直和分解的构造,为此需要使用对角化

定义映射为去除掉数列的第一项

f:WW,(a1,a2,a3,)(a2,a3,a4,)f: W \to W, \quad (a_1, a_2, a_3, \ldots) \mapsto (a_2, a_3, a_4, \ldots)

对于任意的 a,bW\boldsymbol a, \boldsymbol b \in W 以及 kRk \in \mathbb R,都有

f(a+b)=(a2+b2,a3+b3,)=f(a)+f(b)f(ka)=(ka2,ka3,)=kf(a)\begin{aligned} f(\boldsymbol a + \boldsymbol b) &= (a_2 + b_2, a_3 + b_3, \ldots) = f(\boldsymbol a) + f(\boldsymbol b) \\ f(k \boldsymbol a) &= (k a_2, k a_3, \ldots) = k f(\boldsymbol a) \end{aligned}

所以 ffWW 上的线性变换

现计算基的映射值,通过基的坐标可以表示为

f(e1)=(0,q,pq,p2q+q2,)=0e1+qe2f(e2)=(1,p,p2+q,p3+2pq,)=1e1+pe2\begin{aligned} f(\boldsymbol e_1) &= (0, q, p q, p^2 q + q^2, \ldots) = 0 \cdot \boldsymbol e_1 + q \cdot \boldsymbol e_2 \\ f(\boldsymbol e_2) &= (1, p, p^2 + q, p^3 + 2 p q, \ldots) = 1 \cdot \boldsymbol e_1 + p \cdot \boldsymbol e_2 \end{aligned}

所以 ff 关于基 {e1,e2}\{\boldsymbol e_1, \boldsymbol e_2\}矩阵表示为

T=(01qp)T = \begin{pmatrix}0 & 1 \\ q & p \end{pmatrix}

计算特征多项式

FT(λ)=λ1qpλ=λ2pλqF_T(\lambda) = \begin{vmatrix}-\lambda & 1 \\ q & p - \lambda \end{vmatrix} = \lambda^2 - p \lambda - q

对于特征值 λ\lambda,通过解方程 (λET)x=0(\lambda E - T) \boldsymbol x = \boldsymbol 0 得出特征多项式

(λ1qλp)Rref(λ100)p=(1λ)\begin{pmatrix} \lambda & -1 \\ -q & \lambda - p \end{pmatrix} \xrightarrow{\text{Rref}} \begin{pmatrix} \lambda & -1 \\ 0 & 0 \end{pmatrix} \to \boldsymbol p = \begin{pmatrix} 1 \\ \lambda \end{pmatrix}

不失一般性,可以假设解出了两个相异的非零特征值 α,β\alpha, \beta,则可以得到新的基向量

u1=(e1e2)(1α)=e1+αe2,u2=(e1e2)(1β)=e1+βe2\boldsymbol u_1 = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} \begin{pmatrix} 1 \\ \alpha \end{pmatrix} = \boldsymbol e_1 + \alpha \boldsymbol e_2,\quad \boldsymbol u_2 = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} \begin{pmatrix} 1 \\ \beta \end{pmatrix} = \boldsymbol e_1 + \beta \boldsymbol e_2

此时 U:=(u1u2)\mathscr U := \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} 也是 WW 的一组基底
整理成矩阵形式可以得到

(u1u2)=(e1e2)(11αβ)\begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ \alpha & \beta \end{pmatrix}

所以

P:=(11αβ)P := \begin{pmatrix} 1 & 1 \\ \alpha & \beta \end{pmatrix}

为从基 E\mathscr E 到基 U\mathscr U 的过渡矩阵
这是一个更加漂亮的正交基,因为两个基向量之间互不干涉

根据对角化的计算,可以得到

(u1u2)1T(u1u2)=(α00β)(f(u1)f(u2))=(u1u2)(α00β)\begin{aligned} \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix}^{-1} \cdot T \cdot \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} &= \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix} \\ \begin{pmatrix} f(\boldsymbol u_1) & f(\boldsymbol u_2) \end{pmatrix} &= \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix} \end{aligned}

所以,矩阵

D:=(α00β)D := \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix}

为映射 ff 关于基 {u1,u2}\{\boldsymbol u_1, \boldsymbol u_2\} 的矩阵表示

f(u1)=αu1    (u12,u13,u14,)=(αu11,αu12,αu13,)f(u2)=βu2    (u22,u23,u24,)=(βu21,βu22,βu23,)\begin{aligned} f(\boldsymbol u_1) &= \alpha \boldsymbol u_1 \implies (u_1^2, u_1^3, u_1^4, \ldots) = (\alpha u_1^1, \alpha u_1^2, \alpha u_1^3, \ldots) \\ f(\boldsymbol u_2) &= \beta \boldsymbol u_2 \implies (u_2^2, u_2^3, u_2^4, \ldots) = (\beta u_2^1, \beta u_2^2, \beta u_2^3, \ldots) \end{aligned}

解得通项

{u1n=αn1u11=αn1u2n=βn1u21=βn1\begin{cases} u_1^n = \alpha^{n-1} u_1^1 = \alpha^{n-1} \\ u_2^n = \beta^{n-1} u_2^1 = \beta^{n-1} \end{cases}

这样一来,通过坐标变换,对于任意的 wW\boldsymbol w \in W,都有

[w]U=P1[w]E=1βα(β1α1)(w1w2)=1βα(βw1w2αw1+w2)[\boldsymbol w]_{\mathscr U} = P^{-1} [\boldsymbol w]_{\mathscr E} = \frac{1}{\beta - \alpha} \begin{pmatrix} \beta & -1 \\ -\alpha & 1 \end{pmatrix} \begin{pmatrix} w_1 \\ w_2 \end{pmatrix} = \frac{1}{\beta - \alpha} \begin{pmatrix} \beta w_1 - w_2 \\ -\alpha w_1 + w_2 \end{pmatrix}

这样一来,代入 U\mathscr U 的基向量通项公式,可以得到数列 w\boldsymbol w 的通项公式

w=βw1w2βαu1+αw1+w2βαu2    wn=βw1w2βααn1+αw1+w2βαβn1\begin{aligned} \boldsymbol w &= \frac{\beta w_1 - w_2}{\beta - \alpha} \boldsymbol u_1 + \frac{-\alpha w_1 + w_2}{\beta - \alpha} \boldsymbol u_2 \\ \implies w_n &= \frac{\beta w_1 - w_2}{\beta - \alpha} \alpha^{n-1} + \frac{-\alpha w_1 + w_2}{\beta - \alpha} \beta^{n-1} \end{aligned}

示例
求解 Fibonacci 数列

a1=1,a2=1,an+2=an+1+ana_1 = 1, a_2 = 1, a_{n+2} = a_{n+1} + a_n

的通项公式

该例中 p=q=1p = q = 1,特征多项式为

λ2λ1=0    {α=1+52β=152\lambda^2 - \lambda - 1 = 0 \implies \begin{cases} \alpha = \frac{1 + \sqrt{5}}{2} \\ \beta = \frac{1 - \sqrt{5}}{2} \end{cases}

代入通项公式

an=β11βααn1+α1+1βαβn1=15((1+52)n(152)n)\begin{aligned} a_n &= \frac{\beta \cdot 1 - 1}{\beta - \alpha} \alpha^{n-1} + \frac{-\alpha \cdot 1 + 1}{\beta - \alpha} \beta^{n-1} \\ &= \frac{1}{\sqrt{5}} \left( \left(\frac{1 + \sqrt{5}}{2}\right)^n - \left(\frac{1 - \sqrt{5}}{2}\right)^n \right) \end{aligned}

\square

# 线性微分方程

同时含有函数 y=f(x)y = f(x) 及其导数 y=dydxy' = \frac{dy}{dx} 的方程称为 微分方程
V:=C(R)V := C^\infty(\mathbb R),即所有在实数域上无限可微的函数全体,不难验证其在函数加法与数乘下构成实线性空间

任取实数 p,qRp,q \in \mathbb R。定义 VV 中拥有基于 p,qp,q 的线性微分方程全体

W:={yVd2ydx2=pdydx+qy}W := \{y \in V \mid \frac{d^2 y}{dx^2} = p \frac{d y}{dx} + q y\}

显然零函数 y=0y = 0 属于 WW
任取 y1,y2Wy_1, y_2 \in W,以及 kRk \in \mathbb R,则

d2dx2(y1+y2)=d2y1dx2+d2y2dx2=pdy1dx+qy1+pdy2dx+qy2=pddx(y1+y2)+q(y1+y2)d2dx2(ky1)=kd2y1dx2=k(pdy1dx+qy1)=pddx(ky1)+q(ky1)\begin{aligned} \frac{d^2}{dx^2} (y_1 + y_2) &= \frac{d^2 y_1}{dx^2} + \frac{d^2 y_2}{dx^2} = p \frac{d y_1}{dx} + q y_1 + p \frac{d y_2}{dx} + q y_2 \\ &= p \frac{d}{dx} (y_1 + y_2) + q (y_1 + y_2) \\ \frac{d^2}{dx^2} (k y_1) &= k \frac{d^2 y_1}{dx^2} = k (p \frac{d y_1}{dx} + q y_1) = p \frac{d}{dx} (k y_1) + q (k y_1) \end{aligned}

所以 WW 在加法与数乘下封闭,成为 VV 的子空间

定义函数 y1,y2Wy_1, y_2 \in W,使得

{y1(1)=1,y1(1)=0y2(1)=0,y2(1)=1\begin{cases} y_1(1) = 1, \quad y_1'(1) = 0 \\ y_2(1) = 0, \quad y_2'(1) = 1 \end{cases}

建立线性方程组

(y1y2)(c1c2)=0\begin{pmatrix} y_1 & y_2 \end{pmatrix} \begin{pmatrix} c_1 \\ c_2 \end{pmatrix} = 0

整理等式

{c1y1(1)+c2y2(1)=0c1y1(1)+c2y2(1)=0\begin{cases} c_1 \cdot y_1(1) + c_2 \cdot y_2(1) = 0 \\ c_1 \cdot y_1'(1) + c_2 \cdot y_2'(1) = 0 \\ \vdots \end{cases}

对比前两项不难看出,方程唯一解为 c1=c2=0c_1 = c_2 = 0,所以 y1,y2y_1, y_2 线性无关

任取函数 yWy \in W,则

(y1y2)(y(1)y(1))=(y(1)y(1))\begin{pmatrix} y_1 & y_2 \end{pmatrix} \begin{pmatrix} y(1) \\ y'(1) \end{pmatrix} = \begin{pmatrix} y(1) \\ y'(1) \end{pmatrix}

根据 WW 的递推式定义,将 yy 代换为 dydx\frac{dy}{dx} 则可以获得 d3ydx3\frac{d^3 y}{dx^3} 的取值,依此类推,可以唯一确定 yy 的所有阶导数值,所以可以唯一确定函数 yy,因此

y=y(1)y1+y(1)y2y = y(1) y_1 + y'(1) y_2

因此 $ {y_1, y_2} $ 张成 WW
综上所述,Y=(y1y2)\mathscr Y = \begin{pmatrix} y_1 & y_2 \end{pmatrix} 构成 WW 的一组基底,且 dimW=2\dim W = 2

现在寻找更漂亮的基
定义映射为求导

f:WC(R),ydydxf: W \to C^\infty(\mathbb R), \quad y \mapsto \frac{d y}{dx}

对于任意的 y1,y2Wy_1, y_2 \in W 以及 kRk \in \mathbb R,都有

f(y1+y2)=ddx(y1+y2)=dy1dx+dy2dx=f(y1)+f(y2)f(ky1)=ddx(ky1)=kdy1dx=kf(y1)\begin{aligned} f(y_1 + y_2) &= \frac{d}{dx} (y_1 + y_2) = \frac{d y_1}{dx} + \frac{d y_2}{dx} = f(y_1) + f(y_2) \\ f(k y_1) &= \frac{d}{dx} (k y_1) = k \frac{d y_1}{dx} = k f(y_1) \end{aligned}

所以这是线性映射。
另外,对于任意 yWy \in W,定义给出 yy 满足

d2ydx2=pdydx+qy\frac{d^2 y}{dx^2} = p \frac{d y}{dx} + q y

对其两边同时微分,得到

d2dx2(dydx)=pddx(dydx)+qdydx\frac{d^2}{dx^2} \left( \frac{d y}{dx} \right) = p \frac{d}{dx} \left( \frac{d y}{dx} \right) + q \frac{d y}{dx}

这意味着 dydxW\dfrac{d y}{dx} \in W,所以 ffWW 上的线性变换

现计算基的映射值

f(y1)=y1    {y1(1)=0y1(1)=py1(1)+qy1(1)=qf(y2)=y2    {y2(1)=1y2(1)=py2(1)+qy2(1)=p\begin{aligned} f(y_1) &= y_1' \implies \begin{cases} y_1'(1) = 0 \\ y_1''(1) = p \cdot y_1'(1) + q \cdot y_1(1) = q \end{cases} \\ f(y_2) &= y_2' \implies \begin{cases} y_2'(1) = 1 \\ y_2''(1) = p \cdot y_2'(1) + q \cdot y_2(1) = p \end{cases} \end{aligned}

所以 ff 关于基 Y=(y1y2)\mathscr Y = \begin{pmatrix} y_1 & y_2 \end{pmatrix}矩阵表示为

T=(01qp)T = \begin{pmatrix} 0 & 1 \\ q & p \end{pmatrix}

计算特征多项式

FT(λ)=λ1qpλ=λ2pλqF_T(\lambda) = \begin{vmatrix} -\lambda & 1 \\ q & p - \lambda \end{vmatrix} = \lambda^2 - p \lambda - q

对于特征值 λ\lambda,通过解方程 (λET)x=0(\lambda E - T) \boldsymbol x = \boldsymbol 0 得出特征多项式

(λ1qλp)Rref(λ100)p=(1λ)\begin{pmatrix} \lambda & -1 \\ -q & \lambda - p \end{pmatrix} \xrightarrow{\text{Rref}} \begin{pmatrix} \lambda & -1 \\ 0 & 0 \end{pmatrix} \to \boldsymbol p = \begin{pmatrix} 1 \\ \lambda \end{pmatrix}

不失一般性,可以假设解出了两个相异的非零特征值 α,β\alpha, \beta,则可以得到新的基向量

u1=(y1y2)(1α)=y1+αy2,u2=(y1y2)(1β)=y1+βy2\begin{aligned} \boldsymbol u_1 &= \begin{pmatrix} y_1 & y_2 \end{pmatrix} \begin{pmatrix} 1 \\ \alpha \end{pmatrix} = y_1 + \alpha y_2, \\ \boldsymbol u_2 &= \begin{pmatrix} y_1 & y_2 \end{pmatrix} \begin{pmatrix} 1 \\ \beta \end{pmatrix} = y_1 + \beta y_2 \end{aligned}

此时 U:=(u1u2)\mathscr U := \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} 也是 WW 的一组基底
整理成矩阵形式可以得到

(u1u2)=(y1y2)(11αβ)\begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} = \begin{pmatrix} y_1 & y_2 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ \alpha & \beta \end{pmatrix}

所以

P:=(11αβ)P := \begin{pmatrix} 1 & 1 \\ \alpha & \beta \end{pmatrix}

为从基 Y\mathscr Y 到基 U\mathscr U 的过渡矩阵

根据对角化的计算,可以得到

(u1u2)1T(u1u2)=(α00β)(f(u1)f(u2))=(u1u2)(α00β)\begin{aligned} \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix}^{-1} \cdot T \cdot \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} &= \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix} \\ \begin{pmatrix} f(\boldsymbol u_1) & f(\boldsymbol u_2) \end{pmatrix} &= \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 \end{pmatrix} \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix} \end{aligned}

所以,矩阵

D:=(α00β)D := \begin{pmatrix} \alpha & 0 \\ 0 & \beta \end{pmatrix}

为映射 ff 关于基 {u1,u2}\{\boldsymbol u_1, \boldsymbol u_2\} 的矩阵表示

f(u1)=αu1    (du1dx)=αu1f(u2)=βu2    (du2dx)=βu2\begin{aligned} f(\boldsymbol u_1) &= \alpha \boldsymbol u_1 \implies \left( \frac{d u_1}{dx} \right) = \alpha u_1 \\ f(\boldsymbol u_2) &= \beta \boldsymbol u_2 \implies \left( \frac{d u_2}{dx} \right) = \beta u_2 \end{aligned}

对等式两边同时积分,解得通项

1u1du1=αdx    lnu1=αx+C1    u1=C1eαx1u2du2=βdx    lnu2=βx+C2    u2=C2eβx\begin{aligned} \int \frac{1}{u_1} d u_1 &= \int \alpha d x \implies \ln |u_1| = \alpha x + C_1 \implies u_1 = C_1 e^{\alpha x} \\ \int \frac{1}{u_2} d u_2 &= \int \beta d x \implies \ln |u_2| = \beta x + C_2 \implies u_2 = C_2 e^{\beta x} \end{aligned}

由于积分中出现的常数 C1,C2C_1, C_2 是任意的,所以任意函数 yWy \in W 都可以表示为通解

y(x)=C1eαx+C2eβxy(x) = C_1 e^{\alpha x} + C_2 e^{\beta x}

通过联立初期方程可以解得常数获得特解。假设初始条件为 a,ba,b,那么

{a=y(0)=C1+C2b=y(0)=αC1+βC2    {C1=bβaαβC2=αabαβ\begin{cases} a = y(0) = C_1 + C_2 \\ b = y'(0) = \alpha C_1 + \beta C_2 \end{cases} \implies \begin{cases} C_1 = \frac{b - \beta a}{\alpha - \beta} \\ C_2 = \frac{\alpha a - b}{\alpha - \beta} \end{cases}

示例
求解微分方程

d2ydx2=5dydx+6y\frac{d^2 y}{dx^2} = -5 \frac{d y}{dx} + 6 y

满足初始条件

{y(0)=2y(0)=3\begin{cases} y(0) = 2 \\ y'(0) = 3 \end{cases}

特征多项式为

λ2+5λ6=0    {α=1β=6\lambda^2 + 5 \lambda - 6 = 0 \implies \begin{cases} \alpha = 1 \\ \beta = -6 \end{cases}

代入通项公式

y(x)=C1ex+C2e6xy(x) = C_1 e^{x} + C_2 e^{-6 x}

联立初期方程可以解得常数

{2=C1+C23=C16C2    {C1=157C2=17\begin{cases} 2 = C_1 + C_2 \\ 3 = C_1 - 6 C_2 \end{cases} \implies \begin{cases} C_1 = \frac{15}{7} \\ C_2 = -\frac{1}{7} \end{cases}

所以最终解为

y(x)=157ex17e6xy(x) = \frac{15}{7} e^{x} - \frac{1}{7} e^{-6 x}

\square

# 二次型

任意的二次曲线都可以通过正交矩阵的对角化,改写为标准形式,称为 二次型 (Quadratic Form)「二次形式」

一般的,二次曲线指的是形如

f(x,y)=ax2+bxy+cy2+dx+ey+f=0f(x,y) = a x^2 + b x y + c y^2 + d x + e y + f = 0

的曲线,其中系数 a,b,c,d,e,fRa,b,c,d,e,f \in \mathbb R,且不全为零

在学习过矩阵后,对任意方程都应该产生联想:是否可以用矩阵表示
定义二次系数矩阵 AA,变量矩阵 x\boldsymbol x,一次系数矩阵 BB

A=(ab2b2c),x=(xy),B=(de)A = \begin{pmatrix} a & \frac{b}{2} \\ \frac{b}{2} & c \end{pmatrix}, \quad \boldsymbol x = \begin{pmatrix} x \\ y \end{pmatrix}, \quad B = \begin{pmatrix} d & e \end{pmatrix}

则二次曲线可以表示为

txAx+Bx+f=0{}^t \boldsymbol x A \boldsymbol x + B \boldsymbol x + f = 0

不难看出 AA 是实对称矩阵,所以可以由正交矩阵 PP 对角化,将上述方程改写为

txPP1APP1x+BPP1x+f=0{}^t \boldsymbol x P P^{-1} A P P^{-1} \boldsymbol x + B P P^{-1} \boldsymbol x + f = 0

λ1,λ2\lambda_1, \lambda_2AA 的特征值,设

BP=(de),P1x=(xy)B P = \begin{pmatrix} d' & e' \end{pmatrix}, \quad P^{-1} \boldsymbol x = \begin{pmatrix} x' \\ y' \end{pmatrix}

则二次曲线可以表示为

λ1x2+λ2y2+dx+ey+f=0\lambda_1 {x'}^2 + \lambda_2 {y'}^2 + d' x' + e' y' + f = 0

通过配方,可以将其改写为标准形式

λ1X2+λ2Y2+k=0\lambda_1 X^2 + \lambda_2 Y^2 + k = 0

其中(实际上只需要关注 kk 的表达式)

{X=x+d2λ1Y=y+e2λ2k=fd24λ1e24λ2\begin{cases} X = x' + \dfrac{d'}{2 \lambda_1} \\[10pt] Y = y' + \dfrac{e'}{2 \lambda_2} \\[10pt] k = f - \dfrac{d'^2}{4 \lambda_1} - \dfrac{e'^2}{4 \lambda_2} \end{cases}

宏观上,这是通过换元来实现更加漂亮的结构。对角化可以轻松地找出代换的系数
基于初等数学知识,不难看出

  • λ1\lambda_1 或者 λ2\lambda_2 有一方为零,则曲线为抛物线
  • λ1,λ2\lambda_1, \lambda_2 同号
    • λ1k<0\lambda_1 k \lt 0 时,曲线为椭圆
    • λ1k>0\lambda_1 k \gt 0 时,曲线为空集
    • k=0k = 0 时,曲线为单点
  • λ1,λ2\lambda_1, \lambda_2 异号
    • k0k \neq 0 时,曲线为双曲线
    • k=0k = 0 时,曲线为两条相交直线

标准型实际上是在维持曲线形状不变的情况下,对坐标系进行旋转与平移,从而得到的更加简洁的表达形式

示例
将二次曲线

5x2+5y26xy262x+222y+66=05x^2 + 5y^2 - 6xy - 26\sqrt{2}x + 22\sqrt{2}y + 66 = 0

化为标准形式,并指出其类型

整理方程为

(xy)(5335):=A(xy)+(262222)(xy)+66=0\begin{pmatrix} x & y \end{pmatrix} \underbrace{\begin{pmatrix} 5 & -3 \\ -3 & 5 \end{pmatrix}}_{:= A} \begin{pmatrix} x \\ y \end{pmatrix} +\begin{pmatrix} -26\sqrt{2} & 22\sqrt{2} \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} + 66 = 0

求出 AA 的特征值

FA(λ)=5λ335λ=(5λ)29=λ210λ+16=(λ2)(λ8)\begin{aligned} F_A(\lambda) &= \begin{vmatrix} 5 - \lambda & -3 \\ -3 & 5 - \lambda \end{vmatrix} = (5 - \lambda)^2 - 9 \\ &= \lambda^2 - 10 \lambda + 16 = (\lambda - 2)(\lambda - 8) \end{aligned}

解得 λ1=2,λ2=8\lambda_1 = 2, \lambda_2 = 8

  • 对于 λ1=2\lambda_1 = 2,解方程 (λ1EA)x=0(\lambda_1 E - A) \boldsymbol x = \boldsymbol 0 得出特征向量

(3333)Rref(1100)p1=(11)\begin{pmatrix} 3 & -3 \\ -3 & 3 \end{pmatrix} \xrightarrow{\text{Rref}} \begin{pmatrix} 1 & -1 \\ 0 & 0 \end{pmatrix} \to \boldsymbol p_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}

  • 对于 λ2=8\lambda_2 = 8,解方程 (λ2EA)x=0(\lambda_2 E - A) \boldsymbol x = \boldsymbol 0 得出特征向量

(3333)Rref(1100)p2=(11)\begin{pmatrix} -3 & -3 \\ -3 & -3 \end{pmatrix} \xrightarrow{\text{Rref}} \begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix} \to \boldsymbol p_2 = \begin{pmatrix} -1 \\ 1 \end{pmatrix}

构造正交矩阵

P=12(1111)P = \frac{1}{\sqrt{2}} \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix}

计算

BP=(262222)12(1111)=(448)k=66(4)24248248=8\begin{aligned} BP &= \begin{pmatrix} -26\sqrt{2} & 22\sqrt{2} \end{pmatrix} \cdot \frac{1}{\sqrt{2}} \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix} &= \begin{pmatrix} -4 & 48 \end{pmatrix} \\ k &= 66 - \dfrac{(-4)^2}{4 \cdot 2} - \dfrac{48^2}{4 \cdot 8} = -8 \end{aligned}

则方程通过配方改写为

2X2+8Y28=02 X^2 + 8 Y^2 - 8 = 0

此时特征值同号,且 k<0k \lt 0,所以该二次曲线为椭圆
\square

  • 不妨在画图软件中看看两个曲线形状是不是一样的