统计推断 (Statistical Inference) 是数理统计的核心内容
目前通过样本的选取与样本量的计算,可以得到
- 样本平均 Xn=n1∑i=1nXi
- 样本方差 s2=n1∑i=1n(Xi−Xn)2
自然,这些样本统计量会被期待与接近总体参数,但是重点在于究竟有多接近
由于总体参数是不可知的,所以推断统计无法判断得到类似 “总体平均是 Xn” 这样的结论
而是得到类似 “总体平均应该很接近 Xn”
通常有两个方向:点估计与区间估计
# 点估计
目标:构造总体参数的单值估计
通常采取的方法有
# 无偏估计
考虑如下一般情况
针对某总体参数 θ
若某样本统计量 θ^=θ^(X1,X2,…,Xn) 服从的概率分布的期望值为 θ,即
E[θ^]=θ
则称 θ^ 为 θ 的 无偏估计量 (Unbiased Estimator)「不偏推定量」
命题
总体平均 μ 和总体方差 σ2 的无偏估计量分别为
μ^=Xn=n1i=1∑nXi
σ^2=S2=n−11i=1∑n(Xi−Xn)2
# 最小方差无偏估计
无偏估计量只要求期望值一致。直观上也能明白:可以做出许多种不同的分布但是期望值相同的估计量
为了进一步限制估计量的准确性,定义
针对总体参数 θ 的所有无偏估计量当中,方差最小的估计量称为 θ 的 最小方差无偏估计 (Minimum Variance Unbiased Estimator, MVUE)「最小分散不偏推定量」
# 一致估计
此外,还可以依据一致性来进一步筛选估计量
若某推定量 θ^ 对于任意 ε>0 都满足
n→∞limP(∣θ^−θ∣≥ε)=1
则称 θ^ 为 θ 的 一致估计量 (Consistent Estimator)「一致推定量」
# 极大似然估计
极大似然估计法 (Maximum Likelihood Estimation, MLE) 基于无偏估计
设样本 X1,X2,…,Xn 来自密度函数 f(x;θ) 的总体
其中 θ 为未知参数,虽然一般来说密度函数不含参数,但是由于此处强调对 θ 的估计,所以将其写出
则样本的联合密度函数
L(X1,X2,…,Xn;θ)=f(X1;θ)f(X2;θ)⋯f(Xn;θ)
称为样本的 似然函数 (Likelihood Function)「尤度関数」
通过代入样本数据,可以将似然函数视为 θ 的函数 L(θ)
极大似然估计法的目标是找到使得似然函数 L(θ) 取最大值的 θ,记为 θ^,称为 θ 的 极大似然估计量 (Maximum Likelihood Estimator)「最尤推定量」
# 区间估计
目标:给出参数可能范围的置信区间
区间估计需要先取一个 显著性水平 (Confidence Level)「有意水準」 α
通常来说取 5% 或 1%,表示允许有 5% 或 1% 的概率错误
在此系数下计算得到的区间称为 置信区间 (Confidence Interval)「信頼区間」
也就是说,对于总体参数 θ,通过样本计算得到的置信区间 [L,U] 满足
P(L≤θ≤U)=1−α
# 估计总体平均(已知总体方差)
核心是进行标准化得到服从标准正态分布的统计量
考虑服从正态分布的总体 N(μ,σ2),其中 σ2 已知,目标是推测总体平均 μ
注意,即使对于非正态分布,也可以基于中心极限定理,在样本量足够大的情况下使用此方法
取样本 X1,X2,…,Xn,计算得到样本平均 Xn,此时 Xn∼N(μ,nσ2),则
Z=σ/nXn−μ∼N(0,1)
此时利用标准正态分布表,查出两侧 α 点 ±z(α),则有
P(−z(α)≤Z≤z(α))=1−α
![标准正态分布两侧分点]()
代入 Z 的表达式,得到
P(Xn−z(α)nσ≤μ≤Xn+z(α)nσ)=1−α
此时区间 [Xn−z(α)nσ,Xn+z(α)nσ] 即为 μ 的显著性水平 α 下的置信区间
# 估计总体平均(未知总体方差)
核心是利用 t 分布进行估计,使用无偏方差 S2 作为代替
取样本 X1,X2,…,Xn,此时
t=S2/nXn−μ∼t(n−1)
利用 t 分布表,查出两侧 α 点 ±tn−1(α),则有
P(−tn−1(α)≤t≤tn−1(α))=1−α
代入得到
P(Xn−tn−1(α)nS2≤μ≤Xn+tn−1(α)nS2)=1−α
此时区间 [Xn−tn−1(α)nS2,Xn+tn−1(α)nS2] 即为 μ 的显著性水平 α 下的置信区间
# 估计总体比例
核心是利用二项分布的正态近似
总体比例指的是,总体中满足某一特征(属于集合 A)的个体所占的比例,记为 p
随机取出 n 个样本,记符合条件的数量
Sn=#{Xi∣Xi∈A,i=1,2,…,n}
则显然 Sn∼B(n,p),也就是说
P(Sn=k)=(kn)pk(1−p)n−k,E[Sn]=np,V[Sn]=np(1−p)
利用中心极限定理章节的 De Moivre–Laplace 定理可以知道,在 n→∞ 时
T=np(1−p)Sn−np∼N(0,1)
所以问题转回标准正态分布
P(−z(α)≤T≤z(α))=1−α
代入 T 的表达式,得到
P(nSn−z(α)np(1−p)≤p≤nSn+z(α)np(1−p))=1−α
虽然总体方差未知,但是通过无偏估计量可知 p^ 与 p 之间只有 O(n1) 的差距,所以作为替换,可以将不等式两边改写为
P(p^−z(α)np^(1−p^)≤p≤p^+z(α)np^(1−p^))=1−α
此时区间 [p^−z(α)np^(1−p^),p^+z(α)np^(1−p^)] 即为 p 的显著性水平 α 下的置信区间
# 估计总体平均之差(已知总体方差)
核心是借由正态分布的四则性质
考虑两个服从正态分布的总体 N(μ1,σ12) 和 N(μ2,σ22),其中 σ12 和 σ22 已知,目标是推测总体平均之差 μ1−μ2
分别取样本 X1,X2,…,Xn1 和 Y1,Y2,…,Yn2,则
Z=n1σ12+n2σ22(Xn1−Yn2)−(μ1−μ2)∼N(0,1)
同样根据标准正态分布
P(−z(α)≤Z≤z(α))=1−α
代入 Z 的表达式,得到
P⎝⎛(Xn1−Yn2)−z(α)n1σ12+n2σ22≤μ1−μ2≤(Xn1−Yn2)+z(α)n1σ12+n2σ22⎠⎞=1−α
此时区间 [(Xn1−Yn2)−z(α)n1σ12+n2σ22,(Xn1−Yn2)+z(α)n1σ12+n2σ22] 即为 μ1−μ2 的显著性水平 α 下的置信区间
# 估计总体平均之差(未知总体方差)
# 估计总体方差(已知总体平均)
核心是利用卡方分布
考虑服从正态分布的总体 N(μ,σ2),其中 μ 已知,目标是推测总体方差 σ2
取样本 X1,X2,…,Xn,则
χ2=σ2∑i=1n(Xi−μ)2=σ2(n−1)S2∼χ2(n−1)
利用卡方分布表,查出两侧 α 点 χn−12(α) 和 χn−12(1−α),则有
P(χn−12(α)≤χ2≤χn−12(1−α))=1−α
代入 χ2 的表达式,得到
P(χn−12(1−α)(n−1)S2≤σ2≤χn−12(α)(n−1)S2)=1−α
此时区间 [χn−12(1−α)(n−1)S2,χn−12(α)(n−1)S2] 即为 σ2 的显著性水平 α 下的置信区间
# 估计总体方差(未知总体平均)
核心是 Fisher-Cochran 定理
定理 Fisher-Cochran 定理
对于来自正态总体 N(μ,σ2) 的样本 X1,X2,…,Xn
σ2∑i=1n(Xi−Xn)2∼χ2(n−1)
且 (n−1)S2 与 Xn 相互独立
利用此定理,可以实现不使用总体平均的前提下估计总体方差
取样本 X1,X2,…,Xn,则
χ2=σ2∑i=1n(Xi−Xn)2∼χ2(n−1)
利用卡方分布表,查出两侧 α 点 χn−12(α) 和 χn−12(1−α),则有
P(χn−12(α)≤χ2≤χn−12(1−α))=1−α
代入 χ2 的表达式,得到
P(χn−12(1−α)∑i=1n(Xi−Xn)2≤σ2≤χn−12(α)∑i=1n(Xi−Xn)2)=1−α
此时区间 [χn−12(1−α)∑i=1n(Xi−Xn)2,χn−12(α)∑i=1n(Xi−Xn)2] 即为 σ2 的显著性水平 α 下的置信区间