本章对几个常见的抽样分布进行介绍
需要明确的是,抽样分布本质上还是概率分布
重点在于如何做出服从对应抽样分布的统计量,并以此进行计算
# 卡方分布
对于自然数 n,由
fn(x)=⎩⎪⎨⎪⎧2n/2Γ(n/2)1xn/2−1e−x/2,0,x>0otherwise
给出的概率分布称为自由度 n 的 卡方分布 (Chi-Squared Distribution)「カイ二乗分布」,记为 χ2(n)
其中
Γ(t)=∫0+∞xt−1e−xdx
为 Gamma 函数,满足 Γ(t+1)=tΓ(t) 以及 \Gamma(1/2) = \sqrt
命题
对于 χ2(n) 分布
- 期望值 E[χ2]=n
- 方差 V[χ2]=2n
- 矩母函数 Mχ2(t)=(1−2t)−n/2,t<21
证明
概率良定性
∫0+∞fn(x)dx=2n/2Γ(n/2)1∫0+∞xn/2−1e−x/2dx
令 y=2x,则 x=2y,dx=2dy
=2n/2Γ(n/2)1∫0+∞(2y)n/2−1e−y⋅2dy=2n/2Γ(n/2)2n/2∫0+∞yn/2−1e−ydy=Γ(n/2)Γ(n/2)=1
矩母函数
Mχ2(t)=E[etχ2]=∫0+∞etxfn(x)dx=2n/2Γ(n/2)1∫0+∞xn/2−1e−x/2+txdx
令 u=(21−t)x,则 x=21−tu,dx=21−tdu
=2n/2Γ(n/2)1∫0+∞(21−tu)n/2−1e−u⋅21−tdu=2n/2Γ(n/2)1⋅(21−t)n/21∫0+∞un/2−1e−udu=2n/2Γ(n/2)1⋅(21−t)n/21Γ(2n)=(1−2t)−n/2
期望值
E[χ2]=Mχ2′(0)=2n(1−2t)−n/2−1⋅2∣∣∣∣t=0=n
方差
E[χ4]=Mχ2′′(0)=4n(n+2)(1−2t)−n/2−2⋅4∣∣∣∣∣t=0=n(n+2)
V[χ2]=E[χ4]−(E[χ2])2=n(n+2)−n2=2n
□
命题
自由度 n 的 χ2 分布实际上是 Gamma 分布 Γ(2n,2)(形状参数 n/2,尺度参数 2)
统计量的构造
命题
若 X∼N(0,En),即 n 个随机变量独立同分布于标准正态分布,令
χ2=i=1∑nXi2
则 χ2∼χ2(n)
证明
由于 Xi∼N(0,1),其平方 Xi2 的矩母函数为:
MXi2(t)=E[etXi2]=∫−∞∞etx22π1e−x2/2dx=2π1∫−∞∞e−21−2tx2dx=(1−2t)−1/2
由于 Xi 相互独立,和的矩母函数等于矩母函数的积:
M∑Xi2(t)=i=1∏n(1−2t)−1/2=(1−2t)−n/2
这正是 χ2(n) 的矩母函数。
□
性质上,若 χ12∼χ2(n1),χ22∼χ2(n2) 且 χ12,χ22 独立,则有
χ12+χ22∼χ2(n1+n2)
基于标准正态分布的制作方法,可以推广到 N(μ,σ2),令
χ2=i=1∑n(σXi−μ)2
则 χ2∼χ2(n)
此外,由于总平均 μ 往往未知,所以应用上最常用和关键的制作方法是令
χ2=i=1∑n(σXi−Xn)2=σ2(n−1)S2
则 χ2∼χ2(n−1)
- 注意:自由度从 n 变为 n−1,是因为样本均值 X 的计算引入了一个线性约束 ∑(Xi−X)=0,消耗了一个自由度(Cochran 定理)
# F 分布
对于自然数 m,n,由
fm,n(x)=⎩⎪⎨⎪⎧B(m/2,n/2)mm/2nn/2(mx+n)(m+n)/2xm/2−1,0,x>0otherwise
给出的概率分布称为分子自由度 m,分母自由度 n 的 F 分布 (F Distribution)「F 分布」,记为 F(m,n)
其中 B(p,q)=Γ(p+q)Γ(p)Γ(q) 为 Beta 函数
命题
对于 F(m,n) 分布
- 期望值 E[F]=n−2n,n>2
- 方差 V[F]=m(n−2)2(n−4)2n2(m+n−2),n>4
证明
直接对 PDF 进行积分非常繁琐。利用 F 分布的构造定义证明更为简洁。
由定义知,若 U∼χ2(m),V∼χ2(n) 且独立,则 F=V/nU/m。
先计算 χ2(k) 的倒数期望。设 Y∼χ2(k):
E[Yr]=∫0∞xr2k/2Γ(k/2)1xk/2−1e−x/2dx=Γ(k/2)2rΓ(k/2+r)
所以
E[V−1]=Γ(n/2)2−1Γ(n/2−1)=21n/2−11=n−21(n>2)
E[V−2]=Γ(n/2)2−2Γ(n/2−2)=41(n/2−1)(n/2−2)1=(n−2)(n−4)1(n>4)
期望值
由于 U,V 独立
E[F]=mnE[U]E[V−1]=mn⋅m⋅n−21=n−2n
方差
E[F2]=m2n2E[U2]E[V−2]
已知 E[U2]=V[U]+(E[U])2=2m+m2=m(m+2)
E[F2]=m2n2⋅m(m+2)⋅(n−2)(n−4)1=m(n−2)(n−4)n2(m+2)
V[F]=E[F2]−(E[F])2=m(n−2)(n−4)n2(m+2)−(n−2n)2
通分整理后得
V[F]=m(n−2)2(n−4)2n2(m+n−2)
□
统计量的构造
命题
若 χ12∼χ2(m),χ22∼χ2(n) 且 χ12,χ22 独立,令
F=χ22/nχ12/m
则 F∼F(m,n)
一般地
从服从正态分布 N(μ1,σ12) 的总体中抽取 m 个样本 X1,…,Xm
从服从正态分布 N(μ2,σ22) 的总体中抽取 n 个样本 Y1,…,Yn,令
F=SY2/σ22SX2/σ12
则 F∼F(m−1,n−1)
- 其中 SX2,SY2 为样本的无偏方差(分母为 n−1)
# t 分布
对于自然数 n,由
fn(x)=nB(2n,21)1(1+nx2)−2n+1,x∈R
给出的概率分布称为自由度 n 的 t 分布 (Student's t-Distribution)「t 分布」,记为 t(n)
命题
对于 t(n) 分布
- 期望值 E[t]=0,n>1
- 方差 V[t]=n−2n,n>2
证明
利用 t 分布的构造定义证明。
由定义知,若 Z∼N(0,1),V∼χ2(n) 且独立,则 t=V/nZ。
期望值
由于 Z 与 V 独立,且 E[Z]=0
E[t]=E[Z]E[V/n1]=0⋅E[V/n1]=0
方差
V[t]=E[t2]−(E[t])2=E[V/nZ2]−0=nE[Z2]E[V−1]
已知 E[Z2]=V[Z]+(E[Z])2=1,且此前已证 E[V^{-1}] = \frac{1}
V[t]=n⋅1⋅n−21=n−2n
□
统计量的构造
命题
若 Z∼N(0,1),χ2∼χ2(n) 且 Z,χ2 独立,令
t=χ2/nZ
则 t∼t(n)
特别地,令
t2=χ2/nZ2∼F(1,n)
一般地,从服从正态分布 N(μ,σ2) 的总体中抽取 n 个样本 X1,X2,…,Xn,令
t=S/nXn−μ
则 t∼t(n−1)
- 其中 S 为样本无偏标准差(分母为 n−1)
内容已经过 Gemini 3.0 Pro 审查