# 内积空间
定义
令 V 为域 F 上的线性空间,称映射
⟨⋅,⋅⟩:V×V→F
为 V 上的 内积 (Inner Product)「内積」,当且仅当对任意 a,b,c∈V,以及任意 k∈F,满足以下条件
- 正定性:⟨a,a⟩≥0,且当且仅当 a=0 时取等号
- 共轭对称性:⟨a,b⟩=⟨b,a⟩
- 线性性:⟨ka+b,c⟩=k⟨a,c⟩+⟨b,c⟩
- 称配备了内积的线性空间为 内积空间 (Inner Product Space)「内積空間」
- 共轭对称性也称 Hermitian 对称性
!注意,目前我们只考虑两类系数上的内积空间
- 若域 F 为实数域 R,则称其为 实内积空间
- 若域 F 为复数域 C,则称其为 复内积空间
实际上,如果指定是在 R 上的线性空间,那么由于系数共轭 k=k,所以
- 共轭对称性转为一般的对称性:⟨a,b⟩=⟨b,a⟩
- 线性性转为双线性:⟨ka+b,c⟩=k⟨a,c⟩+⟨b,c⟩,且 ⟨a,kb+c⟩=k⟨a,b⟩+⟨a,c⟩
对于内积空间中的元 a,定义
∥a∥=⟨a,a⟩
称为 a 的 范数 (Norm)「ノルム」,这是对向量长度的衡量指标
配备了范数的线性空间称为 赋范线性空间 (Normed Linear Space)「ノルム付き線形空間」
所有的内积空间都是赋范空间,但是反过来不成立
示例
在多维实数空间 Rn 中,定义
⟨a,b⟩=ta⋅b=i=1∑naibi
则 Rn 配备该内积后成为一个内积空间,该内积称为 Euclidean 内积 (Euclidean Inner Product)「ユークリッド内積」,也称为 点积 或 数量积
示例
在多维复数空间 Cn 中,定义
⟨a,b⟩=ta⋅b=i=1∑naibi
则 Cn 配备该内积后成为一个内积空间,该内积称为 Hermitian 内积 (Hermitian Inner Product)「エルミート内積」,也称为 复点积
- 显然的,Euclidean 内积是 Hermitian 内积在实数域上的特例
内积具备两个基本的不等式关系
定理 Cauchy-Schwarz 不等式
令 V 为域 F 上的内积空间,则对任意 a,b∈V,都有
∣⟨a,b⟩∣2≤∥a∥2∥b∥2
证明
若 b=0,则不等式显然成立,不妨设 b=0
对于任意 s,t∈F,线性给出
0≤⟨sa+tb,sa+tb⟩=∣s∣2⟨a,a⟩+st⟨a,b⟩+st⟨b,a⟩+∣t∣2⟨b,b⟩
令 s=⟨b,a⟩,t=−⟨b,b⟩,则有
0≤∣⟨b,a⟩∣2⟨a,a⟩−⟨b,a⟩⟨b,b⟩⟨a,b⟩−⟨b,a⟩⟨b,b⟩⟨b,a⟩+∣⟨b,b⟩∣2⟨b,b⟩
整理得
∣⟨b,b⟩∣2⟨b,b⟩≥∣⟨b,a⟩∣2⟨a,a⟩
即
∣⟨a,b⟩∣2≤∥a∥2∥b∥2
□
- 注意:由于内积 ⟨a,b⟩ 退化为 F 中的数值,因此内积的范数可以简单写为模长 ∣⟨a,b⟩∣
定理 三角不等式
令 V 为域 F 上的内积空间,则对任意 a,b∈V,都有
∥a+b∥≤∥a∥+∥b∥
证明
由范数定义与内积的线性性,有
∥a+b∥2=⟨a+b,a+b⟩=⟨a,a⟩+⟨a,b⟩+⟨b,a⟩+⟨b,b⟩=∥a∥2+2Re(⟨a,b⟩)+∥b∥2≤∥a∥2+2∣⟨a,b⟩∣+∥b∥2≤∥a∥2+2∥a∥∥b∥+∥b∥2=(∥a∥+∥b∥)2
取平方根即得
∥a+b∥≤∥a∥+∥b∥
□
# 正交归一基
类似在平面几何中,Eucliden 内积为 0 等价于,两个向量互相垂直
在内积空间中,称两个向量 a,b 互相 正交 (Orthogonal)「直交」,当且仅当
⟨a,b⟩=0
进一步可以从向量之间的正交关系,推广到子空间的正交关系
令内积空间 V 的子空间 W,定义与 W 的全体向量都正交的向量集合
W⊥={v∈V∣⟨v,w⟩=0,∀w∈W}
称 W⊥ 为 W 的 正交补 (Orthogonal Complement)「直交補空間」
利用正交补,可以对任意 V 执行正交分解
命题
令 V 为域 F 上的内积空间,W⊆V 为其子空间,则
V=W⊕W⊥
证明
首先需要证明 W⊥ 为 V 的子空间
显然零向量正交于任意向量,因此 0∈W⊥
任取 a,b∈W⊥,则对任意 w∈W,都有
⟨a+b,w⟩=⟨a,w⟩+⟨b,w⟩=0+0=0
因此 a+b∈W⊥ 成立
对于任意 k∈F,有
⟨ka,w⟩=k⟨a,w⟩=k⋅0=0
因此 ka∈W⊥ 成立
所以 W⊥ 为 V 的子空间
接下来证明 V⊆W+W⊥
任取 v∈V,则对任意 w∈W,都有
⟨v−w,w⟩=⟨v,w⟩−⟨w,w⟩
令 w′=⟨w,w⟩⟨v,w⟩w,则有
⟨v−w′,w⟩=⟨v,w⟩−⟨w′,w⟩=⟨v,w⟩−⟨w,w⟩⟨v,w⟩⟨w,w⟩=0
因此 v−w′∈W⊥,所以 v=w′+(v−w′)∈W+W⊥ 成立
所以 V⊆W+W⊥ 成立
最后证明 W∩W⊥={0}
任取 v∈W∩W⊥,则有
⟨v,v⟩=0
由内积的正定性可知 v=0,因此 W∩W⊥⊆{0} 成立
综上所述,V=W⊕W⊥
□
两个向量正交,意味着它们的方向完全不一致。而正交对于基来说意义更加重大,两个正交的基向量意味着它们最大程度地独立,不会出现冗余,这使得利用这组基来表示向量时,它地坐标能真正意义上地反映向量在各个方向上的分量。
同时,为了消除没有必要的数量级影响(因为我们只关注线性空间的生成方向),所有的基都可以方向不变地缩短到单位长度。
这样一来,就得到了线性空间中最关键的骨架
定义
令 V 为域 F 上的内积空间
称其的一组基 U=(u1u2⋯un) 为 正交归一基 (Orthonormal Basis)「直交正規基底」,当且仅当
∀i,j∈{1,2,…,n}:⟨ui,uj⟩=δij
- 其中 δij 为 Kronecker-delta 符号,定义为
δij={1,0,i=ji=j
示例
在 R3 中,标准正交归一基为
E=(e1e2e3)=⎝⎛⎝⎛100⎠⎞⎝⎛010⎠⎞⎝⎛001⎠⎞⎠⎞
如果能在内积空间 V 上构建出一组正交归一基,那么基于该基的坐标,任意内积运算都可以退化为 Hermitian 内积的形式
命题
令 V 为域 F 上的内积空间,U=(u1u2⋯un) 为 V 上的一组正交归一基
若任意向量 a,b∈V 在该基下的坐标分别为
[a]U=⎝⎜⎜⎜⎜⎛a1a2⋮an⎠⎟⎟⎟⎟⎞,[b]U=⎝⎜⎜⎜⎜⎛b1b2⋮bn⎠⎟⎟⎟⎟⎞
则有
⟨a,b⟩=i=1∑naibi
证明
由内积的线性
⟨a,b⟩=⟨i=1∑naiui,j=1∑nbjuj⟩=i=1∑nj=1∑naibj⟨ui,uj⟩=i=1∑nj=1∑naibjδij=i=1∑naibi
□
正交归一基如此完美,以至于我们想在任意的内积空间中都能构造出一组正交归一基
想象一组空间中线性独立的基向量,一般地它们并不互相正交。
选取其中某一个作为修正的起点,接下来维持它的位置不变。
选取第二个操作的基向量,目的是通过某种变换让它与第一个基向量正交。
显然,胡乱的改变它的方向只可能导致信息被破坏,甚至不构成基的结构。所以需要考虑投影
命题
令 V 为域 F 上的内积空间,W⊆V 为其子空间
取 W 的一组正交基 W=(w1w2⋯wm)
此时对于任意 v∈V,定义
projW(v)=i=1∑m⟨wi,wi⟩⟨v,wi⟩wi
称其为 v 在子空间 W 上的 正交投影 (Orthogonal Projection)「正射影」
此时有 projW(v)∈W,且 v−projW(v)⊥W
证明
显然 projW(v) 为 W 的线性组合,因此 projW(v)∈W 成立
任取 w∈W,则存在 k1,k2,…,km∈F,使得
w=i=1∑mkiwi
因此
⟨v−projW(v),w⟩=⟨v−i=1∑m⟨wi,wi⟩⟨v,wi⟩wi,j=1∑mkjwj⟩=j=1∑mkj⟨v,wj⟩−i=1∑mj=1∑m⟨wi,wi⟩⟨v,wi⟩kj⟨wi,wj⟩=j=1∑mkj⟨v,wj⟩−i=1∑m⟨wi,wi⟩⟨v,wi⟩ki⟨wi,wi⟩=0
因此 v−projW(v)⊥W 成立
□
这个结论指出,对于任意给定的向量 v,和子空间 W,都可以将 v 分解为两个部分
- 一个是处于子空间 W 上的投影 projW(v)
- 另一个是与子空间 W 正交的部分 v−projW(v)
这里的 v−projW(v) 就是我们需要的,将 v 调整为与 W 正交的向量,这样一来就获得了两个正交的基向量
重复上述思路,对第三个基向量进行类似的处理,取其在前两个基向量张成的子空间上的投影,然后减去该投影,得到一个与前两个基向量正交的向量
如此反复,直到所有的基向量都被处理完毕,就得到了一个正交基
将每个基向量除以其范数,就得到了正交归一基。这个流程被称为 Gram-Schmidt 正交化过程 (Gram-Schmidt Orthogonalization Process)「グラム・シュミットの直交化法」
Gram-Schmidt 正交化过程保证了在任意内积空间中,都能构造出一组正交归一基
接下来用式子表述上述流程
给定内积空间 V 上的一组基 A=(a1a2⋯an)
对第一个向量进行固定处理,设
b1=a1
将第二个向量,减去其在第一个向量所张子空间上的投影,设
b2=a2−proj⟨b1⟩(a2)=a2−⟨b1,b1⟩⟨a2,b1⟩b1
将第三个向量,减去其在前两个向量所张子空间上的投影,设
b3=a3−proj⟨b1,b2⟩(a3)=a3−⟨b1,b1⟩⟨a3,b1⟩b1−⟨b2,b2⟩⟨a3,b2⟩b2
依此类推,直到第 n 个向量,设
bn=an−i=1∑n−1⟨bi,bi⟩⟨an,bi⟩bi
则 B=(b1b2⋯bn) 为 V 上的一组正交基
将每个向量归一化,设
ui=∥bi∥bi,i=1,2,…,n
则 U=(u1u2⋯un) 为 V 上的一组正交归一基
可以用过度矩阵表示上述过程
(b1b2⋯bn)(u1u2⋯un)=(a1a2⋯an)⎝⎜⎜⎜⎜⎜⎜⎜⎛100⋮0−⟨b1,b1⟩⟨a2,b1⟩10⋮0−⟨b1,b1⟩⟨a3,b1⟩−⟨b2,b2⟩⟨a3,b2⟩1⋮0⋯⋯⋯⋱⋯−⟨b1,b1⟩⟨an,b1⟩−⟨b2,b2⟩⟨an,b2⟩−⟨b3,b3⟩⟨an,b3⟩⋮1⎠⎟⎟⎟⎟⎟⎟⎟⎞=(b1b2⋯bn)⎝⎜⎜⎜⎜⎜⎜⎜⎛∥b1∥100⋮00∥b2∥10⋮000∥b3∥1⋮0⋯⋯⋯⋱⋯000⋮∥bn∥1⎠⎟⎟⎟⎟⎟⎟⎟⎞=(a1a2⋯an)⎝⎜⎜⎜⎜⎜⎜⎜⎛100⋮0−⟨b1,b1⟩⟨a2,b1⟩10⋮0−⟨b1,b1⟩⟨a3,b1⟩−⟨b2,b2⟩⟨a3,b2⟩1⋮0⋯⋯⋯⋱⋯−⟨b1,b1⟩⟨an,b1⟩−⟨b2,b2⟩⟨an,b2⟩−⟨b3,b3⟩⟨an,b3⟩⋮1⎠⎟⎟⎟⎟⎟⎟⎟⎞⎝⎜⎜⎜⎜⎜⎜⎜⎛∥b1∥100⋮00∥b2∥10⋮000∥b3∥1⋮0⋯⋯⋯⋱⋯000⋮∥bn∥1⎠⎟⎟⎟⎟⎟⎟⎟⎞=(a1a2⋯an)⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛∥b1∥100⋮0−⟨b1,b1⟩∥b2∥⟨a2,b1⟩∥b2∥10⋮0−⟨b1,b1⟩∥b3∥⟨a3,b1⟩−⟨b2,b2⟩∥b3∥⟨a3,b2⟩∥b3∥1⋮0⋯⋯⋯⋱⋯−⟨b1,b1⟩∥bn∥⟨an,b1⟩−⟨b2,b2⟩∥bn∥⟨an,b2⟩−⟨b3,b3⟩∥bn∥⟨an,b3⟩⋮∥bn∥1⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞
示例
在 R3 中,取一组基
A=(a1a2a3)=⎝⎛⎝⎛110⎠⎞⎝⎛101⎠⎞⎝⎛011⎠⎞⎠⎞
要求基于该基构造一组正交归一基
解
首先对 a1 进行处理,设
b1=a1=⎝⎛110⎠⎞
接着对 a2 进行处理,设
b2=a2−proj⟨b1⟩(a2)=a2−⟨b1,b1⟩⟨a2,b1⟩b1=⎝⎛101⎠⎞−12+12+021⋅1+0⋅1+1⋅0⎝⎛110⎠⎞=⎝⎛101⎠⎞−21⎝⎛110⎠⎞=⎝⎛21−211⎠⎞
最后对 a3 进行处理,设
b3=a3−proj⟨b1,b2⟩(a3)=a3−⟨b1,b1⟩⟨a3,b1⟩b1−⟨b2,b2⟩⟨a3,b2⟩b2=⎝⎛011⎠⎞−12+12+020⋅1+1⋅1+1⋅0⎝⎛110⎠⎞−(21)2+(−21)2+120⋅21+1⋅−21+1⋅1⎝⎛21−211⎠⎞=⎝⎛011⎠⎞−21⎝⎛110⎠⎞−41+41+121⎝⎛21−211⎠⎞=⎝⎛011⎠⎞−21⎝⎛110⎠⎞−2321⎝⎛21−211⎠⎞=⎝⎛011⎠⎞−⎝⎛21210⎠⎞−⎝⎛61−6132⎠⎞=⎝⎛−323231⎠⎞
因此 B=(b1b2b3) 为 R3 上的一组正交基
将每个向量归一化,设
u1u2u3=∥b1∥b1=21⎝⎛110⎠⎞=∥b2∥b2=(21)2+(−21)2+121⎝⎛21−211⎠⎞=231⎝⎛21−211⎠⎞=32⎝⎛21−211⎠⎞=⎝⎜⎜⎛66−6636⎠⎟⎟⎞=∥b3∥b3=(−32)2+(32)2+(31)21⎝⎛−323231⎠⎞=991⎝⎛−323231⎠⎞=⎝⎛−323231⎠⎞
则 U=(u1u2u3) 为 R3 上的一组正交归一基
□
# 酉变换与伴随变换
线性变换会将向量从一个位置映射到另一个位置
很自然产生的疑问是:是否存在某种特殊的线性变换,能够保持内积不变?
即线性变换 f:V→V 满足
∀a,b∈V:⟨f(a),f(b)⟩=⟨a,b⟩
为了分析该问题,取 V 上的一组正交归一基 U=(u1u2⋯un)
令 A 为 f 在 U 下的矩阵表示,即
(f(u1)f(u2)⋯f(un))=(u1u2⋯un)A
那么,对于任意 V 中的两个向量 a,b,取其在 U 下的坐标表示
a=(u1u2⋯un)[a]U,b=(u1u2⋯un)[b]U
将其经由线性变换 f 映射后,有(注意过渡矩阵的定义)
f(a)=(u1u2⋯un)A[a]U,f(b)=(u1u2⋯un)A[b]U
那么,条件 ⟨f(a),f(b)⟩=⟨a,b⟩ 等价于 Hermitian 内积形式下的等式
A[a]U⋅A[b]U=[a]U⋅[b]U
也就是说
t[a]UtAA[b]U=t[a]U[b]U
由于上述等式对任意 [a]U,[b]U∈Fn 都成立,只需要代入 [a]U=ei,[b]U=ej 即可得到
tAA=En
- 在实内积空间中,称满足 tAA=En 的矩阵为 正交矩阵 (Orthogonal Matrix)「直交行列」
- 在复内积空间中,称满足 tAA=En 的矩阵为 酉矩阵 (Unitary Matrix)「ユニタリ行列」
满足该性质的线性变换
- 在实内积空间中,称为 正交变换 (Orthogonal Transformation)「直交変換」
- 在复内积空间中,称为 酉变换 (Unitary Transformation)「ユニタリ変換」
显然,正交是酉的特例。(实际上酉也是辛的特例,在本线性代数中不予介绍)
酉变换保有内积,这意味着它是等长的,同时这也是构造正交归一基的重要工具
命题
令 n 阶复数方阵 A,以下等价
- A 为酉矩阵
- A 的列向量组构成 Cn 上的一组正交归一基
- 对任意 x∈Cn,有 ∥Ax∥=∥x∥
证明
(1) ⇒ (2)
根据酉矩阵的定义,有 tAA=En,因此
⎝⎜⎜⎜⎜⎛ta1ta2⋮tan⎠⎟⎟⎟⎟⎞(a1a2⋯an)=En
等价于
∀i,j∈{1,2,…,n}:⟨ai,aj⟩=δij
(1) ⇒ (3)
由于 tAA=En,因此
∥Ax∥2=⟨Ax,Ax⟩=t(Ax)(Ax)=txtAAx=txEnx=⟨x,x⟩=∥x∥2
(3) ⇒ (1)
任取 x,y∈Cn,根据等长性,有
∥A(x+y)∥2−∥A(x)∥2−∥A(y)∥2=∥x+y∥2−∥x∥2−∥y∥2
同时,将范数展开得到
∥A(x+y)∥2−∥A(x)∥2−∥A(y)∥2∥x+y∥2−∥x∥2−∥y∥2=⟨Ax,Ay⟩+⟨Ay,Ax⟩=⟨x,y⟩+⟨y,x⟩
因此
⟨Ax,Ay⟩+⟨Ay,Ax⟩=⟨x,y⟩+⟨y,x⟩
同理,有
∥A(x+iy)∥2−∥A(x)∥2−∥A(iy)∥2=∥x+iy∥2−∥x∥2−∥iy∥2
展开得到
⟨Ax,A(iy)⟩+⟨A(iy),Ax⟩=⟨x,iy⟩+⟨iy,x⟩
即
i⟨Ax,Ay⟩−i⟨Ay,Ax⟩=i⟨x,y⟩−i⟨y,x⟩
联立以上两式,得到
⟨Ax,Ay⟩⟨Ay,Ax⟩=⟨x,y⟩=⟨y,x⟩
因此对于任意 x,y∈Cn,都有 ⟨Ax,Ay⟩=⟨x,y⟩
取 x=ei,y=ej,则有
tAA=En
□
- 将该命题中的复数修改为实数,即可得到正交矩阵的类似结论
对于任意给定的线性变换 f:V→V,考察是否可以构造其对偶。即是否存在一个线性变换 f∗:V→V,使得
∀a,b∈V:⟨f(a),b⟩=⟨a,f∗(b)⟩
取 V 上的一组正交归一基 U=(u1u2⋯un)
令 A 为 f 在 U 下的矩阵表示,即
(f(u1)f(u2)⋯f(un))=(u1u2⋯un)A
再设 B 为 f∗ 在 U 下的矩阵表示,即
(f∗(u1)f∗(u2)⋯f∗(un))=(u1u2⋯un)B
那么,条件 ⟨f(a),b⟩=⟨a,f∗(b)⟩ 等价于 Hermitian 内积形式下的等式
A[a]U⋅[b]U=[a]U⋅B[b]U
也就是说
t[a]UtA[b]U=t[a]UB[b]U
由于上述等式对任意 [a]U,[b]U∈Fn 都成立,只需要代入 [a]U=ei,[b]U=ej 即可得到
tA=B
因此,如果用记号表示共轭转置,即 A∗=tA
B=tA=A∗
- 称这样的线性变换 f∗ 为 f 的 伴随变换 (Adjoint Transformation)「随伴変換」,即
- 称矩阵 A∗=tA 为矩阵 A 的 伴随矩阵 (Adjoint Matrix)「随伴行列」,即
在伴随矩阵的记号下
- 酉矩阵的定义可以简化为 A∗A=En
- 定义满足 A∗=A 的矩阵为 Hermitian 矩阵 (Hermitian Matrix)「エルミート行列」。实对称矩阵是 Hermitian 矩阵的特例
- 定义满足 A∗=−A 的矩阵为 斜 Hermitian 矩阵 (Skew-Hermitian Matrix)「歪エルミート行列」。实斜对称矩阵是反 Hermitian 矩阵的特例
类似上述的矩阵,称满足 AA∗=A∗A 的矩阵为 正规矩阵 (Normal Matrix)「正規行列」。
- 酉矩阵,正交矩阵,Hermitian 矩阵,斜 Hermitian 矩阵全部都是正规矩阵的特例
正规矩阵将在接下来的对角化中发挥重要作用