本章对几个常见的抽样分布进行介绍
需要明确的是,抽样分布本质上还是概率分布
但是关注的点应该是如何做出服从对应抽样分布的统计量,并以此进行计算
所以不必过于关注抽样分布的概率密度函数
# 卡方分布
# 定义
对于自然数 n,由
fn(x)=⎩⎪⎨⎪⎧2n/2Γ(n/2)1xn/2−1e−x/2,0,x>0otherwise
给出的概率分布称为自由度 n 的 卡方分布 (Chi-Squared Distribution)「カイ二乗分布」,记为 χ2(n)
其中
Γ(t)=∫0+∞xt−1e−xdx
为 Gamma 函数
# 性质
对于 χ2 分布
- 矩母函数 Mχ2(t)=(1−2t)−n/2,t<21
- 期望值 E[χ2]=n
- 方差 V[χ2]=2n
全概率和验证
∫0+∞fn(x)dx=2n/2Γ(n/2)1∫0+∞xn/2−1e−x/2dx
令 y=2x,则 x=2y,dx=2dy
=2n/2Γ(n/2)1∫0+∞(2y)n/2−1e−y⋅2dy=2n/2Γ(n/2)2n/2∫0+∞yn/2−1e−ydy=Γ(n/2)Γ(n/2)=1
矩母函数推导
Mχ2(t)=E[etχ2]=∫0+∞etxfn(x)dx=2n/2Γ(n/2)1∫0+∞xn/2−1e−x/2+txdx
令 u=(21−t)x,则 x=21−tu,dx=21−tdu
=2n/2Γ(n/2)1∫0+∞(21−tu)n/2−1e−u⋅21−tdu=2n/2Γ(n/2)1⋅(21−t)n/21∫0+∞un/2−1e−udu=2n/2Γ(n/2)1⋅(21−t)n/21Γ(2n)=(21−t)n/21=(1−2t)−n/2
期望值推导
E[χ2]=Mχ2′(0)=2n(1−2⋅0)−n/2−1⋅2=n
方差推导
V[χ2]=E[χ4]−(E[χ2])2=Mχ2′′(0)−n2=4n(n+2)(1−2⋅0)−n/2−2⋅4−n2=n(n+2)−n2=2n
命题
自由度 n 的 X2 分布实际上是 Gamma 分布 Γ(2n,21)
# 统计量制作
命题
若 X∼N(0,En),即 n 个随机变量独立同分布于标准正态分布,令
χ2=i=1∑nXi2
则 χ2∼χ2(n)
证明
性质上,若 χ12∼χ2(n1),χ22∼χ2(n2) 且 χ12,χ22 独立,则有
χ12+χ22∼χ2(n1+n2)
基于标准正态分布的制作方法,可以推广到 N(μ,σ2),令
χ2=i=1∑n(σXi−μ)2
则 χ2∼χ2(n)
此外,由于总平均 μ 往往未知,所以应用上最常用和关键的制作方法是令
χ2=i=1∑n(σXi−Xn)2=σ2ns2
则 χ2∼χ2(n−1),注意自由度不同
# F 分布
# 定义
对于自然数 m,n,由
fm,n(x)=⎩⎪⎨⎪⎧B(m/2,n/2)mm/2nn/2(mx+n)(m+n)/2xm/2−1,0,x>0otherwise
给出的概率分布称为分子自由度 m,分母自由度 n 的 F 分布 (F Distribution)「F 分布」,记为 F(m,n)
其中
B(p,q)=∫01xp−1(1−x)q−1dx
为 Beta 函数
- 矩母函数 MF(t)=2F1(2m,2m+n;2m+1;m+n2mt),t<2mm+n
- 期望值 E[F]=n−2n,n>2
- 方差 V[F]=m(n−2)2(n−4)2n2(m+n−2),n>4
全概率和验证
∫0+∞fm,n(x)dx=B(m/2,n/2)mm/2nn/2∫0+∞(mx+n)(m+n)/2xm/2−1dx
令 y=mx+nmx,则 x=m(1−y)ny,dx=m(1−y)2ndy
=B(m/2,n/2)mm/2nn/2∫01(m⋅m(1−y)ny+n)(m+n)/2(m(1−y)ny)m/2−1⋅m(1−y)2ndy=B(m/2,n/2)mm/2nn/2∫01(1−yn)(m+n)/2(m(1−y)ny)m/2−1⋅m(1−y)2ndy
=B(m/2,n/2)mm/2nn/2∫01mm/2−1n(m+n)/2nm/2−1ym/2−1(1−y)(m+n)/2⋅m(1−y)2ndy=B(m/2,n/2)mm/2nn/2⋅mm/2n(m+n)/2nm/2∫01ym/2−1(1−y)n/2−1dy=B(m/2,n/2)1⋅B(m/2,n/2)=1
# 统计量制作
命题
若 χ12∼χ2(m),χ22∼χ2(n) 且 χ12,χ22 独立,令
F=χ22/nχ12/m
则 F∼F(m,n)
一般地
从服从正态分布 N(μ1,σ12) 的总体中抽取 m 个样本 X1,X2,…,Xm
从服从正态分布 N(μ2,σ22) 的总体中抽取 n 个样本 Y1,Y2,…,Yn,令
F=nsY2/(n−1)σ22msX2/(m−1)σ12
则 F∼F(m−1,n−1)
其中 sX2,sY2 分别为样本 Xi 和 Yj 的样本有偏方差
如果使用无偏方差,则可以记为
F=sY2/σ22sX2/σ12
同样 F∼F(m−1,n−1)
# t 分布
# 定义
对于自然数 n,由
fn(x)=nB(2n,21)1(1+x2/n)(n+1)/21,x∈R
给出的概率分布称为自由度 n 的 t 分布 (Student's t-Distribution)「t 分布」,记为 t(n)
注意:t 分布又称为斯图登特分布,以化名 Student 发表相关论文的威廉・西利・戈塞特命名
# 统计量制作
命题
若 X∼N(0,1),χ2∼χ2(n) 且 X,χ2 独立,令
t=χ2/nX
则 t∼t(n)
特别地,令
t2=χ2/nX2
则 t2∼F(1,n)
一般地,从服从正态分布 N(μ,σ2) 的总体中抽取 n 个样本 X1,X2,…,Xn,令
t=s2/(n−1)Xn−μ
则 t∼t(n−1)
如果使用无偏方差,则可以记为
t=S2/nXn−μ
同样 t∼t(n−1)