# 内积空间

定义
VV 为域 F\mathbb F 上的线性空间,称映射

,:V×VF\langle \cdot, \cdot \rangle : V \times V \to \mathbb F

VV 上的 内积 (Inner Product)「内積」,当且仅当对任意 a,b,cV\boldsymbol a, \boldsymbol b, \boldsymbol c \in V,以及任意 kFk \in \mathbb F,满足以下条件

  • 正定性:a,a0\langle \boldsymbol a, \boldsymbol a \rangle \geq 0,且当且仅当 a=0\boldsymbol a = \boldsymbol 0 时取等号
  • 共轭对称性:a,b=b,a\langle \boldsymbol a, \boldsymbol b \rangle = \overline{\langle \boldsymbol b, \boldsymbol a \rangle} \quad
  • 线性性:ka+b,c=ka,c+b,c\langle k \boldsymbol a + \boldsymbol b, \boldsymbol c \rangle = k \langle \boldsymbol a, \boldsymbol c \rangle + \langle \boldsymbol b, \boldsymbol c \rangle
  • 称配备了内积的线性空间为 内积空间 (Inner Product Space)「内積空間」
  • 共轭对称性也称 Hermitian 对称性

!注意,目前我们只考虑两类系数上的内积空间

  • 若域 F\mathbb F 为实数域 R\mathbb R,则称其为 实内积空间
  • 若域 F\mathbb F 为复数域 C\mathbb C,则称其为 复内积空间

实际上,如果指定是在 R\mathbb R 上的线性空间,那么由于系数共轭 k=k\overline k = k,所以

  • 共轭对称性转为一般的对称性:a,b=b,a\langle \boldsymbol a, \boldsymbol b \rangle = \langle \boldsymbol b, \boldsymbol a \rangle
  • 线性性转为双线性:ka+b,c=ka,c+b,c\langle k \boldsymbol a + \boldsymbol b, \boldsymbol c \rangle = k \langle \boldsymbol a, \boldsymbol c \rangle + \langle \boldsymbol b, \boldsymbol c \rangle,且 a,kb+c=ka,b+a,c\langle \boldsymbol a, k \boldsymbol b + \boldsymbol c \rangle = k \langle \boldsymbol a, \boldsymbol b \rangle + \langle \boldsymbol a, \boldsymbol c \rangle

对于内积空间中的元 a\boldsymbol a,定义

a=a,a\|\boldsymbol a\| = \sqrt{\langle \boldsymbol a, \boldsymbol a \rangle}

称为 a\boldsymbol a范数 (Norm)「ノルム」,这是对向量长度的衡量指标
配备了范数的线性空间称为 赋范线性空间 (Normed Linear Space)「ノルム付き線形空間」
所有的内积空间都是赋范空间,但是反过来不成立

示例
在多维实数空间 Rn\mathbb R^n 中,定义

a,b=tab=i=1naibi\langle \boldsymbol a, \boldsymbol b \rangle = {}^t\boldsymbol a \cdot \boldsymbol b = \sum_{i=1}^n a_i b_i

Rn\mathbb R^n 配备该内积后成为一个内积空间,该内积称为 Euclidean 内积 (Euclidean Inner Product)「ユークリッド内積」,也称为 点积数量积

示例
在多维复数空间 Cn\mathbb C^n 中,定义

a,b=tab=i=1naibi\langle \boldsymbol a, \boldsymbol b \rangle = {}^t\boldsymbol a \cdot \overline{\boldsymbol b} = \sum_{i=1}^n a_i \overline{b_i}

Cn\mathbb C^n 配备该内积后成为一个内积空间,该内积称为 Hermitian 内积 (Hermitian Inner Product)「エルミート内積」,也称为 复点积

  • 显然的,Euclidean 内积是 Hermitian 内积在实数域上的特例

内积具备两个基本的不等式关系

定理 Cauchy-Schwarz 不等式
VV 为域 F\mathbb F 上的内积空间,则对任意 a,bV\boldsymbol a, \boldsymbol b \in V,都有

a,b2a2b2|\langle \boldsymbol a, \boldsymbol b \rangle|^2 \leq \|\boldsymbol a\|^2 \|\boldsymbol b\|^2

证明

b=0\boldsymbol b = \boldsymbol 0,则不等式显然成立,不妨设 b0\boldsymbol b \neq \boldsymbol 0
对于任意 s,tFs,t \in \mathbb F,线性给出

0sa+tb,sa+tb=s2a,a+sta,b+stb,a+t2b,b0 \leq \langle s \boldsymbol a + t \boldsymbol b, s \boldsymbol a + t \boldsymbol b \rangle = |s|^2 \langle \boldsymbol a, \boldsymbol a \rangle + s \overline{t} \langle \boldsymbol a, \boldsymbol b \rangle + \overline{s} t \langle \boldsymbol b, \boldsymbol a \rangle + |t|^2 \langle \boldsymbol b, \boldsymbol b \rangle

s=b,as = \langle \boldsymbol b, \boldsymbol a \ranglet=b,bt = -\langle \boldsymbol b, \boldsymbol b \rangle,则有

0b,a2a,ab,ab,ba,bb,ab,bb,a+b,b2b,b0 \leq |\langle \boldsymbol b, \boldsymbol a \rangle|^2 \langle \boldsymbol a, \boldsymbol a \rangle - \langle \boldsymbol b, \boldsymbol a \rangle \overline{\langle \boldsymbol b, \boldsymbol b \rangle} \langle \boldsymbol a, \boldsymbol b \rangle - \overline{\langle \boldsymbol b, \boldsymbol a \rangle} \langle \boldsymbol b, \boldsymbol b \rangle \langle \boldsymbol b, \boldsymbol a \rangle + |\langle \boldsymbol b, \boldsymbol b \rangle|^2 \langle \boldsymbol b, \boldsymbol b \rangle

整理得

b,b2b,bb,a2a,a|\langle \boldsymbol b, \boldsymbol b \rangle|^2 \langle \boldsymbol b, \boldsymbol b \rangle \geq |\langle \boldsymbol b, \boldsymbol a \rangle|^2 \langle \boldsymbol a, \boldsymbol a \rangle

a,b2a2b2|\langle \boldsymbol a, \boldsymbol b \rangle|^2 \leq \|\boldsymbol a\|^2 \|\boldsymbol b\|^2

\square

  • 注意:由于内积 a,b\langle \boldsymbol a, \boldsymbol b \rangle 退化为 F\mathbb F 中的数值,因此内积的范数可以简单写为模长 a,b|\langle \boldsymbol a, \boldsymbol b \rangle|

定理 三角不等式
VV 为域 F\mathbb F 上的内积空间,则对任意 a,bV\boldsymbol a, \boldsymbol b \in V,都有

a+ba+b\|\boldsymbol a + \boldsymbol b\| \leq \|\boldsymbol a\| + \|\boldsymbol b\|

证明

由范数定义与内积的线性性,有

a+b2=a+b,a+b=a,a+a,b+b,a+b,b=a2+2Re(a,b)+b2a2+2a,b+b2a2+2ab+b2=(a+b)2\begin{aligned} \|\boldsymbol a + \boldsymbol b\|^2 &= \langle \boldsymbol a + \boldsymbol b, \boldsymbol a + \boldsymbol b \rangle \\ &= \langle \boldsymbol a, \boldsymbol a \rangle + \langle \boldsymbol a, \boldsymbol b \rangle + \langle \boldsymbol b, \boldsymbol a \rangle + \langle \boldsymbol b, \boldsymbol b \rangle \\ &= \|\boldsymbol a\|^2 + 2 \mathrm{Re}(\langle \boldsymbol a, \boldsymbol b \rangle) + \|\boldsymbol b\|^2 \\ &\leq \|\boldsymbol a\|^2 + 2 |\langle \boldsymbol a, \boldsymbol b \rangle| + \|\boldsymbol b\|^2 \\ &\leq \|\boldsymbol a\|^2 + 2 \|\boldsymbol a\| \|\boldsymbol b\| + \|\boldsymbol b\|^2 \\ &= (\|\boldsymbol a\| + \|\boldsymbol b\|)^2 \end{aligned}

取平方根即得

a+ba+b\|\boldsymbol a + \boldsymbol b\| \leq \|\boldsymbol a\| + \|\boldsymbol b\|

\square

# 正交归一基

类似在平面几何中,Eucliden 内积为 00 等价于,两个向量互相垂直
在内积空间中,称两个向量 a,b\boldsymbol a, \boldsymbol b 互相 正交 (Orthogonal)「直交」,当且仅当

a,b=0\langle \boldsymbol a, \boldsymbol b \rangle = 0

进一步可以从向量之间的正交关系,推广到子空间的正交关系
令内积空间 VV 的子空间 WW,定义与 WW 的全体向量都正交的向量集合

W={vVv,w=0,wW}W^\perp = \{\boldsymbol v \in V \mid \langle \boldsymbol v, \boldsymbol w \rangle = 0, {}^\forall \boldsymbol w \in W\}

WW^\perpWW正交补 (Orthogonal Complement)「直交補空間」

利用正交补,可以对任意 VV 执行正交分解

命题
VV 为域 F\mathbb F 上的内积空间,WVW \subseteq V 为其子空间,则

V=WWV = W \oplus W^\perp

证明

首先需要证明 WW^\perpVV 的子空间
显然零向量正交于任意向量,因此 0W\boldsymbol 0 \in W^\perp
任取 a,bW\boldsymbol a, \boldsymbol b \in W^\perp,则对任意 wW\boldsymbol w \in W,都有

a+b,w=a,w+b,w=0+0=0\langle \boldsymbol a + \boldsymbol b, \boldsymbol w \rangle = \langle \boldsymbol a, \boldsymbol w \rangle + \langle \boldsymbol b, \boldsymbol w \rangle = 0 + 0 = 0

因此 a+bW\boldsymbol a + \boldsymbol b \in W^\perp 成立
对于任意 kFk \in \mathbb F,有

ka,w=ka,w=k0=0\langle k\boldsymbol a, \boldsymbol w \rangle = k \langle \boldsymbol a, \boldsymbol w \rangle = k \cdot 0 = 0

因此 kaWk\boldsymbol a \in W^\perp 成立
所以 WW^\perpVV 的子空间

接下来证明 VW+WV \subseteq W + W^\perp
任取 vV\boldsymbol v \in V,则对任意 wW\boldsymbol w \in W,都有

vw,w=v,ww,w\langle \boldsymbol v - \boldsymbol w, \boldsymbol w \rangle = \langle \boldsymbol v, \boldsymbol w \rangle - \langle \boldsymbol w, \boldsymbol w \rangle

w=v,ww,ww\boldsymbol w' = \frac{\langle \boldsymbol v, \boldsymbol w \rangle}{\langle \boldsymbol w, \boldsymbol w \rangle} \boldsymbol w,则有

vw,w=v,ww,w=v,wv,ww,ww,w=0\langle \boldsymbol v - \boldsymbol w', \boldsymbol w \rangle = \langle \boldsymbol v, \boldsymbol w \rangle - \langle \boldsymbol w', \boldsymbol w \rangle = \langle \boldsymbol v, \boldsymbol w \rangle - \frac{\langle \boldsymbol v, \boldsymbol w \rangle}{\langle \boldsymbol w, \boldsymbol w \rangle} \langle \boldsymbol w, \boldsymbol w \rangle = 0

因此 vwW\boldsymbol v - \boldsymbol w' \in W^\perp,所以 v=w+(vw)W+W\boldsymbol v = \boldsymbol w' + (\boldsymbol v - \boldsymbol w') \in W + W^\perp 成立
所以 VW+WV \subseteq W + W^\perp 成立

最后证明 WW={0}W \cap W^\perp = \{\boldsymbol 0\}
任取 vWW\boldsymbol v \in W \cap W^\perp,则有

v,v=0\langle \boldsymbol v, \boldsymbol v \rangle = 0

由内积的正定性可知 v=0\boldsymbol v = \boldsymbol 0,因此 WW{0}W \cap W^\perp \subseteq \{\boldsymbol 0\} 成立
综上所述,V=WWV = W \oplus W^\perp
\square

两个向量正交,意味着它们的方向完全不一致。而正交对于基来说意义更加重大,两个正交的基向量意味着它们最大程度地独立,不会出现冗余,这使得利用这组基来表示向量时,它地坐标能真正意义上地反映向量在各个方向上的分量。
同时,为了消除没有必要的数量级影响(因为我们只关注线性空间的生成方向),所有的基都可以方向不变地缩短到单位长度。
这样一来,就得到了线性空间中最关键的骨架

定义
VV 为域 F\mathbb F 上的内积空间
称其的一组基 U=(u1u2un)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix}正交归一基 (Orthonormal Basis)「直交正規基底」,当且仅当

i,j{1,2,,n}:ui,uj=δij{}^\forall i,j \in \{1,2,\dots,n\}: \langle \boldsymbol u_i, \boldsymbol u_j \rangle = \delta_{ij}

  • 其中 δij\delta_{ij} 为 Kronecker-delta 符号,定义为

δij={1,i=j0,ij\delta_{ij} = \begin{cases} 1, & i = j \\ 0, & i \neq j \end{cases}

示例
R3\mathbb R^3 中,标准正交归一基为

E=(e1e2e3)=((100)(010)(001))\mathscr E = \begin{pmatrix} \boldsymbol e_1 & \boldsymbol e_2 & \boldsymbol e_3 \end{pmatrix} = \begin{pmatrix} \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} & \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix} & \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} \end{pmatrix}

如果能在内积空间 VV 上构建出一组正交归一基,那么基于该基的坐标,任意内积运算都可以退化为 Hermitian 内积的形式

命题
VV 为域 F\mathbb F 上的内积空间,U=(u1u2un)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix}VV 上的一组正交归一基
若任意向量 a,bV\boldsymbol a, \boldsymbol b \in V 在该基下的坐标分别为

[a]U=(a1a2an),[b]U=(b1b2bn)[\boldsymbol a]_{\mathscr U} = \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix},\quad [\boldsymbol b]_{\mathscr U} = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{pmatrix}

则有

a,b=i=1naibi\langle \boldsymbol a, \boldsymbol b \rangle = \sum_{i=1}^n a_i \overline{b_i}

证明

由内积的线性

a,b=i=1naiui,j=1nbjuj=i=1nj=1naibjui,uj=i=1nj=1naibjδij=i=1naibi\begin{aligned} \langle \boldsymbol a, \boldsymbol b \rangle &= \left\langle \sum_{i=1}^n a_i \boldsymbol u_i, \sum_{j=1}^n b_j \boldsymbol u_j \right\rangle \\ &= \sum_{i=1}^n \sum_{j=1}^n a_i \overline{b_j} \langle \boldsymbol u_i, \boldsymbol u_j \rangle \\ &= \sum_{i=1}^n \sum_{j=1}^n a_i \overline{b_j} \delta_{ij} \\ &= \sum_{i=1}^n a_i \overline{b_i} \end{aligned}

\square


正交归一基如此完美,以至于我们想在任意的内积空间中都能构造出一组正交归一基

想象一组空间中线性独立的基向量,一般地它们并不互相正交。
选取其中某一个作为修正的起点,接下来维持它的位置不变。
选取第二个操作的基向量,目的是通过某种变换让它与第一个基向量正交。
显然,胡乱的改变它的方向只可能导致信息被破坏,甚至不构成基的结构。所以需要考虑投影

命题
VV 为域 F\mathbb F 上的内积空间,WVW \subseteq V 为其子空间
WW 的一组正交基 W=(w1w2wm)\mathscr W = \begin{pmatrix} \boldsymbol w_1 & \boldsymbol w_2 & \cdots & \boldsymbol w_m \end{pmatrix}
此时对于任意 vV\boldsymbol v \in V,定义

projW(v)=i=1mv,wiwi,wiwi\mathrm{proj}_W(\boldsymbol v) = \sum_{i=1}^m \frac{\langle \boldsymbol v, \boldsymbol w_i \rangle}{\langle \boldsymbol w_i, \boldsymbol w_i \rangle} \boldsymbol w_i

称其为 v\boldsymbol v 在子空间 WW 上的 正交投影 (Orthogonal Projection)「正射影」

此时有 projW(v)W\mathrm{proj}_W(\boldsymbol v) \in W,且 vprojW(v)W\boldsymbol v - \mathrm{proj}_W(\boldsymbol v) \perp W

证明

显然 projW(v)\mathrm{proj}_W(\boldsymbol v)WW 的线性组合,因此 projW(v)W\mathrm{proj}_W(\boldsymbol v) \in W 成立
任取 wW\boldsymbol w \in W,则存在 k1,k2,,kmFk_1, k_2, \dots, k_m \in \mathbb F,使得

w=i=1mkiwi\boldsymbol w = \sum_{i=1}^m k_i \boldsymbol w_i

因此

vprojW(v),w=vi=1mv,wiwi,wiwi,j=1mkjwj=j=1mkjv,wji=1mj=1mv,wiwi,wikjwi,wj=j=1mkjv,wji=1mv,wiwi,wikiwi,wi=0\begin{aligned} \langle \boldsymbol v - \mathrm{proj}_W(\boldsymbol v), \boldsymbol w \rangle &= \left\langle \boldsymbol v - \sum_{i=1}^m \frac{\langle \boldsymbol v, \boldsymbol w_i \rangle}{\langle \boldsymbol w_i, \boldsymbol w_i \rangle} \boldsymbol w_i, \sum_{j=1}^m k_j \boldsymbol w_j \right\rangle \\ &= \sum_{j=1}^m k_j \langle \boldsymbol v, \boldsymbol w_j \rangle - \sum_{i=1}^m \sum_{j=1}^m \frac{\langle \boldsymbol v, \boldsymbol w_i \rangle}{\langle \boldsymbol w_i, \boldsymbol w_i \rangle} k_j \langle \boldsymbol w_i, \boldsymbol w_j \rangle \\ &= \sum_{j=1}^m k_j \langle \boldsymbol v, \boldsymbol w_j \rangle - \sum_{i=1}^m \frac{\langle \boldsymbol v, \boldsymbol w_i \rangle}{\langle \boldsymbol w_i, \boldsymbol w_i \rangle} k_i \langle \boldsymbol w_i, \boldsymbol w_i \rangle \\ &= 0 \end{aligned}

因此 vprojW(v)W\boldsymbol v - \mathrm{proj}_W(\boldsymbol v) \perp W 成立
\square

这个结论指出,对于任意给定的向量 v\boldsymbol v,和子空间 WW,都可以将 v\boldsymbol v 分解为两个部分

  • 一个是处于子空间 WW 上的投影 projW(v)\mathrm{proj}_W(\boldsymbol v)
  • 另一个是与子空间 WW 正交的部分 vprojW(v)\boldsymbol v - \mathrm{proj}_W(\boldsymbol v)

这里的 vprojW(v)\boldsymbol v - \mathrm{proj}_W(\boldsymbol v) 就是我们需要的,将 v\boldsymbol v 调整为与 WW 正交的向量,这样一来就获得了两个正交的基向量

重复上述思路,对第三个基向量进行类似的处理,取其在前两个基向量张成的子空间上的投影,然后减去该投影,得到一个与前两个基向量正交的向量
如此反复,直到所有的基向量都被处理完毕,就得到了一个正交基
将每个基向量除以其范数,就得到了正交归一基。这个流程被称为 Gram-Schmidt 正交化过程 (Gram-Schmidt Orthogonalization Process)「グラム・シュミットの直交化法」
Gram-Schmidt 正交化过程保证了在任意内积空间中,都能构造出一组正交归一基

接下来用式子表述上述流程
给定内积空间 VV 上的一组基 A=(a1a2an)\mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix}
对第一个向量进行固定处理,设

b1=a1\boldsymbol b_1 = \boldsymbol a_1

将第二个向量,减去其在第一个向量所张子空间上的投影,设

b2=a2projb1(a2)=a2a2,b1b1,b1b1\boldsymbol b_2 = \boldsymbol a_2 - \mathrm{proj}_{\langle \boldsymbol b_1 \rangle}(\boldsymbol a_2) = \boldsymbol a_2 - \frac{\langle \boldsymbol a_2, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \boldsymbol b_1

将第三个向量,减去其在前两个向量所张子空间上的投影,设

b3=a3projb1,b2(a3)=a3a3,b1b1,b1b1a3,b2b2,b2b2\boldsymbol b_3 = \boldsymbol a_3 - \mathrm{proj}_{\langle \boldsymbol b_1, \boldsymbol b_2 \rangle}(\boldsymbol a_3) = \boldsymbol a_3 - \frac{\langle \boldsymbol a_3, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \boldsymbol b_1 - \frac{\langle \boldsymbol a_3, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} \boldsymbol b_2

依此类推,直到第 nn 个向量,设

bn=ani=1n1an,bibi,bibi\boldsymbol b_n = \boldsymbol a_n - \sum_{i=1}^{n-1} \frac{\langle \boldsymbol a_n, \boldsymbol b_i \rangle}{\langle \boldsymbol b_i, \boldsymbol b_i \rangle} \boldsymbol b_i

B=(b1b2bn)\mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix}VV 上的一组正交基
将每个向量归一化,设

ui=bibi,i=1,2,,n\boldsymbol u_i = \frac{\boldsymbol b_i}{\|\boldsymbol b_i\|},\quad i = 1,2,\dots,n

U=(u1u2un)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix}VV 上的一组正交归一基
可以用过度矩阵表示上述过程

(b1b2bn)=(a1a2an)(1a2,b1b1,b1a3,b1b1,b1an,b1b1,b101a3,b2b2,b2an,b2b2,b2001an,b3b3,b30001)(u1u2un)=(b1b2bn)(1b100001b200001b300001bn)=(a1a2an)(1a2,b1b1,b1a3,b1b1,b1an,b1b1,b101a3,b2b2,b2an,b2b2,b2001an,b3b3,b30001)(1b100001b200001b300001bn)=(a1a2an)(1b1a2,b1b1,b1b2a3,b1b1,b1b3an,b1b1,b1bn01b2a3,b2b2,b2b3an,b2b2,b2bn001b3an,b3b3,b3bn0001bn)\begin{aligned} \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \begin{pmatrix} 1 & -\frac{\langle \boldsymbol a_2, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} & -\frac{\langle \boldsymbol a_3, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \\ 0 & 1 & -\frac{\langle \boldsymbol a_3, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} \\ 0 & 0 & 1 & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_3 \rangle}{\langle \boldsymbol b_3, \boldsymbol b_3 \rangle} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \end{pmatrix} \\ \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} &= \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \cdots & \boldsymbol b_n \end{pmatrix} \begin{pmatrix} \frac{1}{\|\boldsymbol b_1\|} & 0 & 0 & \cdots & 0 \\ 0 & \frac{1}{\|\boldsymbol b_2\|} & 0 & \cdots & 0 \\ 0 & 0 & \frac{1}{\|\boldsymbol b_3\|} & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \frac{1}{\|\boldsymbol b_n\|} \end{pmatrix} \\ &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \begin{pmatrix} 1 & -\frac{\langle \boldsymbol a_2, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} & -\frac{\langle \boldsymbol a_3, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \\ 0 & 1 & -\frac{\langle \boldsymbol a_3, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} \\ 0 & 0 & 1 & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_3 \rangle}{\langle \boldsymbol b_3, \boldsymbol b_3 \rangle} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \end{pmatrix} \begin{pmatrix} \frac{1}{\|\boldsymbol b_1\|} & 0 & 0 & \cdots & 0 \\ 0 & \frac{1}{\|\boldsymbol b_2\|} & 0 & \cdots & 0 \\ 0 & 0 & \frac{1}{\|\boldsymbol b_3\|} & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \frac{1}{\|\boldsymbol b_n\|} \end{pmatrix} \\ &= \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \cdots & \boldsymbol a_n \end{pmatrix} \begin{pmatrix} \frac{1}{\|\boldsymbol b_1\|} & -\frac{\langle \boldsymbol a_2, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle \|\boldsymbol b_2\|} & -\frac{\langle \boldsymbol a_3, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle \|\boldsymbol b_3\|} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle \|\boldsymbol b_n\|} \\ 0 & \frac{1}{\|\boldsymbol b_2\|} & -\frac{\langle \boldsymbol a_3, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle \|\boldsymbol b_3\|} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle \|\boldsymbol b_n\|} \\ 0 & 0 & \frac{1}{\|\boldsymbol b_3\|} & \cdots & -\frac{\langle \boldsymbol a_n, \boldsymbol b_3 \rangle}{\langle \boldsymbol b_3, \boldsymbol b_3 \rangle \|\boldsymbol b_n\|} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & \frac{1}{\|\boldsymbol b_n\|} \end{pmatrix} \end{aligned}

示例
R3\mathbb R^3 中,取一组基

A=(a1a2a3)=((110)(101)(011))\mathscr A = \begin{pmatrix} \boldsymbol a_1 & \boldsymbol a_2 & \boldsymbol a_3 \end{pmatrix} = \begin{pmatrix} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} & \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} & \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} \end{pmatrix}

要求基于该基构造一组正交归一基

首先对 a1\boldsymbol a_1 进行处理,设

b1=a1=(110)\boldsymbol b_1 = \boldsymbol a_1 = \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix}

接着对 a2\boldsymbol a_2 进行处理,设

b2=a2projb1(a2)=a2a2,b1b1,b1b1=(101)11+01+1012+12+02(110)=(101)12(110)=(12121)\begin{aligned} \boldsymbol b_2 &= \boldsymbol a_2 - \mathrm{proj}_{\langle \boldsymbol b_1 \rangle}(\boldsymbol a_2) \\ &= \boldsymbol a_2 - \frac{\langle \boldsymbol a_2, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \boldsymbol b_1 \\ &= \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} - \frac{1 \cdot 1 + 0 \cdot 1 + 1 \cdot 0}{1^2 + 1^2 + 0^2} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} \\ &= \begin{pmatrix} 1 \\ 0 \\ 1 \end{pmatrix} - \frac{1}{2} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} \\ &= \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} \end{aligned}

最后对 a3\boldsymbol a_3 进行处理,设

b3=a3projb1,b2(a3)=a3a3,b1b1,b1b1a3,b2b2,b2b2=(011)01+11+1012+12+02(110)012+112+11(12)2+(12)2+12(12121)=(011)12(110)1214+14+1(12121)=(011)12(110)1232(12121)=(011)(12120)(161623)=(232313)\begin{aligned} \boldsymbol b_3 &= \boldsymbol a_3 - \mathrm{proj}_{\langle \boldsymbol b_1, \boldsymbol b_2 \rangle}(\boldsymbol a_3) \\ &= \boldsymbol a_3 - \frac{\langle \boldsymbol a_3, \boldsymbol b_1 \rangle}{\langle \boldsymbol b_1, \boldsymbol b_1 \rangle} \boldsymbol b_1 - \frac{\langle \boldsymbol a_3, \boldsymbol b_2 \rangle}{\langle \boldsymbol b_2, \boldsymbol b_2 \rangle} \boldsymbol b_2 \\ &= \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} - \frac{0 \cdot 1 + 1 \cdot 1 + 1 \cdot 0}{1^2 + 1^2 + 0^2} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} - \frac{0 \cdot \frac{1}{2} + 1 \cdot -\frac{1}{2} + 1 \cdot 1}{\left(\frac{1}{2}\right)^2 + \left(-\frac{1}{2}\right)^2 + 1^2} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} - \frac{1}{2} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} - \frac{\frac{1}{2}}{\frac{1}{4} + \frac{1}{4} + 1} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} - \frac{1}{2} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} - \frac{\frac{1}{2}}{\frac{3}{2}} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} \\ &= \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} - \begin{pmatrix} \frac{1}{2} \\ \frac{1}{2} \\ 0 \end{pmatrix} - \begin{pmatrix} \frac{1}{6} \\ -\frac{1}{6} \\ \frac{2}{3} \end{pmatrix} \\ &= \begin{pmatrix} -\frac{2}{3} \\ \frac{2}{3} \\ \frac{1}{3} \end{pmatrix} \end{aligned}

因此 B=(b1b2b3)\mathscr B = \begin{pmatrix} \boldsymbol b_1 & \boldsymbol b_2 & \boldsymbol b_3 \end{pmatrix}R3\mathbb R^3 上的一组正交基
将每个向量归一化,设

u1=b1b1=12(110)u2=b2b2=1(12)2+(12)2+12(12121)=132(12121)=23(12121)=(666663)u3=b3b3=1(23)2+(23)2+(13)2(232313)=199(232313)=(232313)\begin{aligned} \boldsymbol u_1 &= \frac{\boldsymbol b_1}{\|\boldsymbol b_1\|} = \frac{1}{\sqrt{2}} \begin{pmatrix} 1 \\ 1 \\ 0 \end{pmatrix} \\ \boldsymbol u_2 &= \frac{\boldsymbol b_2}{\|\boldsymbol b_2\|} = \frac{1}{\sqrt{\left(\frac{1}{2}\right)^2 + \left(-\frac{1}{2}\right)^2 + 1^2}} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} = \frac{1}{\sqrt{\frac{3}{2}}} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} = \sqrt{\frac{2}{3}} \begin{pmatrix} \frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{pmatrix} = \begin{pmatrix} \frac{\sqrt{6}}{6} \\ -\frac{\sqrt{6}}{6} \\ \frac{\sqrt{6}}{3} \end{pmatrix} \\ \boldsymbol u_3 &= \frac{\boldsymbol b_3}{\|\boldsymbol b_3\|} = \frac{1}{\sqrt{\left(-\frac{2}{3}\right)^2 + \left(\frac{2}{3}\right)^2 + \left(\frac{1}{3}\right)^2}} \begin{pmatrix} -\frac{2}{3} \\ \frac{2}{3} \\ \frac{1}{3} \end{pmatrix} = \frac{1}{\sqrt{\frac{9}{9}}} \begin{pmatrix} -\frac{2}{3} \\ \frac{2}{3} \\ \frac{1}{3} \end{pmatrix} = \begin{pmatrix} -\frac{2}{3} \\ \frac{2}{3} \\ \frac{1}{3} \end{pmatrix} \end{aligned}

U=(u1u2u3)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \boldsymbol u_3 \end{pmatrix}R3\mathbb R^3 上的一组正交归一基
\square

# 酉变换与伴随变换

线性变换会将向量从一个位置映射到另一个位置
很自然产生的疑问是:是否存在某种特殊的线性变换,能够保持内积不变?
即线性变换 f:VVf:V \to V 满足

a,bV:f(a),f(b)=a,b{}^\forall \boldsymbol a, \boldsymbol b \in V: \langle f(\boldsymbol a), f(\boldsymbol b) \rangle = \langle \boldsymbol a, \boldsymbol b \rangle

为了分析该问题,取 VV 上的一组正交归一基 U=(u1u2un)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix}
AAffU\mathscr U 下的矩阵表示,即

(f(u1)f(u2)f(un))=(u1u2un)A\begin{pmatrix} f(\boldsymbol u_1) & f(\boldsymbol u_2) & \cdots & f(\boldsymbol u_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} A

那么,对于任意 VV 中的两个向量 a,b\boldsymbol a, \boldsymbol b,取其在 U\mathscr U 下的坐标表示

a=(u1u2un)[a]U,b=(u1u2un)[b]U\boldsymbol a = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} [\boldsymbol a]_{\mathscr U},\quad \boldsymbol b = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} [\boldsymbol b]_{\mathscr U}

将其经由线性变换 ff 映射后,有(注意过渡矩阵的定义)

f(a)=(u1u2un)A[a]U,f(b)=(u1u2un)A[b]Uf(\boldsymbol a) = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} A [\boldsymbol a]_{\mathscr U},\quad f(\boldsymbol b) = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} A [\boldsymbol b]_{\mathscr U}

那么,条件 f(a),f(b)=a,b\langle f(\boldsymbol a), f(\boldsymbol b) \rangle = \langle \boldsymbol a, \boldsymbol b \rangle 等价于 Hermitian 内积形式下的等式

A[a]UA[b]U=[a]U[b]UA [\boldsymbol a]_{\mathscr U} \cdot \overline{A [\boldsymbol b]_{\mathscr U}} = [\boldsymbol a]_{\mathscr U} \cdot \overline{[\boldsymbol b]_{\mathscr U}}

也就是说

t[a]UtAA[b]U=t[a]U[b]U{}^t[\boldsymbol a]_{\mathscr U} {}^t\!A \overline A \overline{[\boldsymbol b]_{\mathscr U}} = {}^t[\boldsymbol a]_{\mathscr U} \overline{[\boldsymbol b]_{\mathscr U}}

由于上述等式对任意 [a]U,[b]UFn[\boldsymbol a]_{\mathscr U}, [\boldsymbol b]_{\mathscr U} \in \mathbb F^n 都成立,只需要代入 [a]U=ei[\boldsymbol a]_{\mathscr U} = \boldsymbol e_i[b]U=ej[\boldsymbol b]_{\mathscr U} = \boldsymbol e_j 即可得到

tAA=En{}^t\!A \overline A = E_n

  • 在实内积空间中,称满足 tAA=En{}^t\!A A = E_n 的矩阵为 正交矩阵 (Orthogonal Matrix)「直交行列」
  • 在复内积空间中,称满足 tAA=En{}^t\!A \overline A = E_n 的矩阵为 酉矩阵 (Unitary Matrix)「ユニタリ行列」

满足该性质的线性变换

  • 在实内积空间中,称为 正交变换 (Orthogonal Transformation)「直交変換」
  • 在复内积空间中,称为 酉变换 (Unitary Transformation)「ユニタリ変換」

显然,正交是酉的特例。(实际上酉也是辛的特例,在本线性代数中不予介绍)


酉变换保有内积,这意味着它是等长的,同时这也是构造正交归一基的重要工具

命题
nn复数方阵 AA,以下等价

  • AA 为酉矩阵
  • AA 的列向量组构成 Cn\mathbb C^n 上的一组正交归一基
  • 对任意 xCn\boldsymbol x \in \mathbb C^n,有 Ax=x\|A\boldsymbol x\| = \|\boldsymbol x\|
证明

(1) \Rightarrow (2)
根据酉矩阵的定义,有 tAA=En{}^t\!A \overline A = E_n,因此

(ta1ta2tan)(a1a2an)=En\begin{pmatrix} {}^t\!\boldsymbol a_1 \\ {}^t\!\boldsymbol a_2 \\ \vdots \\ {}^t\!\boldsymbol a_n \end{pmatrix} \begin{pmatrix} \overline{\boldsymbol a_1} & \overline{\boldsymbol a_2} & \cdots & \overline{\boldsymbol a_n} \end{pmatrix} = E_n

等价于

i,j{1,2,,n}:ai,aj=δij{}^\forall i,j \in \{1,2,\dots,n\}: \langle \boldsymbol a_i, \boldsymbol a_j \rangle = \delta_{ij}

(1) \Rightarrow (3)
由于 tAA=En{}^t\!A \overline A = E_n,因此

Ax2=Ax,Ax=t(Ax)(Ax)=txtAAx=txEnx=x,x=x2\|A\boldsymbol x\|^2 = \langle A\boldsymbol x, A\boldsymbol x \rangle = {}^t\!(A\boldsymbol x) \overline{(A\boldsymbol x)} = {}^t\!\boldsymbol x {}^t\!A \overline A \overline{\boldsymbol x} = {}^t\!\boldsymbol x E_n \overline{\boldsymbol x} = \langle \boldsymbol x, \boldsymbol x \rangle = \|\boldsymbol x\|^2

(3) \Rightarrow (1)
任取 x,yCn\boldsymbol x, \boldsymbol y \in \mathbb C^n,根据等长性,有

A(x+y)2A(x)2A(y)2=x+y2x2y2\|A(\boldsymbol x + \boldsymbol y)\|^2 - \|A(\boldsymbol x)\|^2 - \|A(\boldsymbol y)\|^2 = \|\boldsymbol x + \boldsymbol y\|^2 - \|\boldsymbol x\|^2 - \|\boldsymbol y\|^2

同时,将范数展开得到

A(x+y)2A(x)2A(y)2=Ax,Ay+Ay,Axx+y2x2y2=x,y+y,x\begin{aligned} \|A(\boldsymbol x + \boldsymbol y)\|^2 - \|A(\boldsymbol x)\|^2 - \|A(\boldsymbol y)\|^2 &= \langle A\boldsymbol x, A\boldsymbol y \rangle + \langle A\boldsymbol y, A\boldsymbol x \rangle \\ \|\boldsymbol x + \boldsymbol y\|^2 - \|\boldsymbol x\|^2 - \|\boldsymbol y\|^2 &= \langle \boldsymbol x, \boldsymbol y \rangle + \langle \boldsymbol y, \boldsymbol x \rangle \end{aligned}

因此

Ax,Ay+Ay,Ax=x,y+y,x\langle A\boldsymbol x, A\boldsymbol y \rangle + \langle A\boldsymbol y, A\boldsymbol x \rangle = \langle \boldsymbol x, \boldsymbol y \rangle + \langle \boldsymbol y, \boldsymbol x \rangle

同理,有

A(x+iy)2A(x)2A(iy)2=x+iy2x2iy2\|A(\boldsymbol x + i\boldsymbol y)\|^2 - \|A(\boldsymbol x)\|^2 - \|A(i\boldsymbol y)\|^2 = \|\boldsymbol x + i\boldsymbol y\|^2 - \|\boldsymbol x\|^2 - \|i\boldsymbol y\|^2

展开得到

Ax,A(iy)+A(iy),Ax=x,iy+iy,x\langle A\boldsymbol x, A(i\boldsymbol y) \rangle + \langle A(i\boldsymbol y), A\boldsymbol x \rangle = \langle \boldsymbol x, i\boldsymbol y \rangle + \langle i\boldsymbol y, \boldsymbol x \rangle

iAx,AyiAy,Ax=ix,yiy,xi \langle A\boldsymbol x, A\boldsymbol y \rangle - i \langle A\boldsymbol y, A\boldsymbol x \rangle = i \langle \boldsymbol x, \boldsymbol y \rangle - i \langle \boldsymbol y, \boldsymbol x \rangle

联立以上两式,得到

Ax,Ay=x,yAy,Ax=y,x\begin{aligned} \langle A\boldsymbol x, A\boldsymbol y \rangle &= \langle \boldsymbol x, \boldsymbol y \rangle \\ \langle A\boldsymbol y, A\boldsymbol x \rangle &= \langle \boldsymbol y, \boldsymbol x \rangle \end{aligned}

因此对于任意 x,yCn\boldsymbol x, \boldsymbol y \in \mathbb C^n,都有 Ax,Ay=x,y\langle A\boldsymbol x, A\boldsymbol y \rangle = \langle \boldsymbol x, \boldsymbol y \rangle
x=ei\boldsymbol x = \boldsymbol e_iy=ej\boldsymbol y = \boldsymbol e_j,则有

tAA=En{}^t\!A \overline A = E_n

\square

  • 将该命题中的复数修改为实数,即可得到正交矩阵的类似结论

对于任意给定的线性变换 f:VVf:V \to V,考察是否可以构造其对偶。即是否存在一个线性变换 f:VVf^*:V \to V,使得

a,bV:f(a),b=a,f(b){}^\forall \boldsymbol a, \boldsymbol b \in V: \langle f(\boldsymbol a), \boldsymbol b \rangle = \langle \boldsymbol a, f^*(\boldsymbol b) \rangle

VV 上的一组正交归一基 U=(u1u2un)\mathscr U = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix}
AAffU\mathscr U 下的矩阵表示,即

(f(u1)f(u2)f(un))=(u1u2un)A\begin{pmatrix} f(\boldsymbol u_1) & f(\boldsymbol u_2) & \cdots & f(\boldsymbol u_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} A

再设 BBff^*U\mathscr U 下的矩阵表示,即

(f(u1)f(u2)f(un))=(u1u2un)B\begin{pmatrix} f^*(\boldsymbol u_1) & f^*(\boldsymbol u_2) & \cdots & f^*(\boldsymbol u_n) \end{pmatrix} = \begin{pmatrix} \boldsymbol u_1 & \boldsymbol u_2 & \cdots & \boldsymbol u_n \end{pmatrix} B

那么,条件 f(a),b=a,f(b)\langle f(\boldsymbol a), \boldsymbol b \rangle = \langle \boldsymbol a, f^*(\boldsymbol b) \rangle 等价于 Hermitian 内积形式下的等式

A[a]U[b]U=[a]UB[b]UA [\boldsymbol a]_{\mathscr U} \cdot \overline{[\boldsymbol b]_{\mathscr U}} = [\boldsymbol a]_{\mathscr U} \cdot \overline{B [\boldsymbol b]_{\mathscr U}}

也就是说

t[a]UtA[b]U=t[a]UB[b]U{}^t[\boldsymbol a]_{\mathscr U} {}^t\!A \overline{[\boldsymbol b]_{\mathscr U}} = {}^t[\boldsymbol a]_{\mathscr U} \overline B \overline{[\boldsymbol b]_{\mathscr U}}

由于上述等式对任意 [a]U,[b]UFn[\boldsymbol a]_{\mathscr U}, [\boldsymbol b]_{\mathscr U} \in \mathbb F^n 都成立,只需要代入 [a]U=ei[\boldsymbol a]_{\mathscr U} = \boldsymbol e_i[b]U=ej[\boldsymbol b]_{\mathscr U} = \boldsymbol e_j 即可得到

tA=B{}^t\!A = \overline B

因此,如果用记号表示共轭转置,即 A=tAA^* = {}^t\!\overline A

B=tA=AB = {}^t\!\overline A = A^*

  • 称这样的线性变换 ff^*ff伴随变换 (Adjoint Transformation)「随伴変換」,即
  • 称矩阵 A=tAA^* = {}^t\!\overline A 为矩阵 AA伴随矩阵 (Adjoint Matrix)「随伴行列」,即

在伴随矩阵的记号下

  • 酉矩阵的定义可以简化为 AA=EnA^* A = E_n
  • 定义满足 A=AA^* = A 的矩阵为 Hermitian 矩阵 (Hermitian Matrix)「エルミート行列」。实对称矩阵是 Hermitian 矩阵的特例
  • 定义满足 A=AA^* = -A 的矩阵为 斜 Hermitian 矩阵 (Skew-Hermitian Matrix)「歪エルミート行列」。实斜对称矩阵是反 Hermitian 矩阵的特例

类似上述的矩阵,称满足 AA=AAA A^* = A^* A 的矩阵为 正规矩阵 (Normal Matrix)「正規行列」

  • 酉矩阵,正交矩阵,Hermitian 矩阵,斜 Hermitian 矩阵全部都是正规矩阵的特例

正规矩阵将在接下来的对角化中发挥重要作用