统计推断 (Statistical Inference) 是数理统计的核心内容
目前通过样本的选取与样本量的计算,可以得到
Xn=n1i=1∑nXi
S2=n−11i=1∑n(Xi−Xn)2
自然,这些样本统计量会被期待与接近总体参数,但是重点在于究竟有多接近
由于总体参数是不可知的,所以推断统计无法判断得到类似 “总体平均是 Xn” 这样的结论
而是得到类似 “总体平均应该很接近 Xn”
通常有两个方向:点估计与区间估计
# 点估计
目标:构造总体参数的单值估计
通常采取的方法有
- 无偏估计
- 最小方差无偏估计
- 一致估计
- 极大似然估计
# 无偏估计
考虑如下一般情况
针对某总体参数 θ
若某样本统计量 θ^=θ^(X1,X2,…,Xn) 服从的概率分布的期望值为 θ,即
E[θ^]=θ
则称 θ^ 为 θ 的 无偏估计量 (Unbiased Estimator)「不偏推定量」
命题
总体平均 μ 和总体方差 σ2 的无偏估计量分别为
μ^=Xn=n1i=1∑nXi
σ^2=S2=n−11i=1∑n(Xi−Xn)2
# 最小方差无偏估计
无偏估计量只要求期望值一致。直观上也能明白:可以做出许多种不同的分布但是期望值相同的估计量
为了进一步限制估计量的准确性,定义
针对总体参数 θ 的所有无偏估计量当中,方差最小的估计量称为 θ 的 最小方差无偏估计 (Minimum Variance Unbiased Estimator, MVUE)「最小分散不偏推定量」
# 一致估计
此外,还可以依据一致性来进一步筛选估计量
若某推定量 θ^ 对于任意 ε>0 都满足
n→∞limP(∣θ^−θ∣≥ε)=0
则称 θ^ 为 θ 的 一致估计量 (Consistent Estimator)「一致推定量」
# 极大似然估计
极大似然估计法 (Maximum Likelihood Estimation, MLE) 是一种基于 “最可能发生” 原则的参数估计方法。
设样本 X1,X2,…,Xn 来自密度函数 f(x;θ) 的总体
其中 θ 为未知参数。则样本的联合密度函数
L(θ)=L(X1,X2,…,Xn;θ)=i=1∏nf(Xi;θ)
称为样本的 似然函数 (Likelihood Function)「尤度関数」
极大似然估计法的目标是找到使得似然函数 L(θ) 取最大值的 θ,记为 θ^,称为 θ 的 极大似然估计量 (Maximum Likelihood Estimator)「最尤推定量」
- 实际计算中,通常对似然函数取对数 lnL(θ),将乘积转化为求和,然后令导数为 0 求解:
dθdlnL(θ)=0
# 区间估计
目标:给出参数可能范围的置信区间
区间估计需要先取一个 显著性水平 (Significance Level)「有意水準」 α
通常来说取 5% 或 1%,表示允许有 5% 或 1% 的概率错误,对应的 置信水平 (Confidence Level)「信頼係数」 为 1−α
在此系数下计算得到的区间称为 置信区间 (Confidence Interval)「信頼区間」
也就是说,对于总体参数 θ,通过样本计算得到的置信区间 [L,U] 满足
P(L≤θ≤U)=1−α
# 估计总体平均(已知总体方差)
核心是进行标准化得到服从标准正态分布的统计量
考虑服从正态分布的总体 N(μ,σ2),其中 σ2 已知,目标是推测总体平均 μ
注意,即使对于非正态分布,也可以基于中心极限定理,在样本量足够大的情况下使用此方法
取样本 X1,X2,…,Xn,计算得到样本平均 Xn,此时 Xn∼N(μ,nσ2),则
Z=σ/nXn−μ∼N(0,1)
此时利用标准正态分布表,查出双侧 α 分位点 zα/2(即 P(Z>zα/2)=α/2),则有
P(−zα/2≤Z≤zα/2)=1−α
代入 Z 的表达式,得到
P(Xn−zα/2nσ≤μ≤Xn+zα/2nσ)=1−α
此时区间 [Xn−zα/2nσ,Xn+zα/2nσ] 即为 μ 的置信水平 1−α 下的置信区间
# 估计总体平均(未知总体方差)
核心是利用 t 分布进行估计,使用无偏方差 S2 作为代替
取样本 X1,X2,…,Xn,此时
t=S2/nXn−μ∼t(n−1)
利用 t 分布表,查出双侧 α 分位点 tα/2(n−1),则有
P(−tα/2(n−1)≤t≤tα/2(n−1))=1−α
代入得到
P(Xn−tα/2(n−1)nS2≤μ≤Xn+tα/2(n−1)nS2)=1−α
此时区间 [Xn−tα/2(n−1)nS2,Xn+tα/2(n−1)nS2] 即为 μ 的置信水平 1−α 下的置信区间
# 估计总体比例
核心是利用二项分布的正态近似
总体比例指的是,总体中满足某一特征(属于集合 A)的个体所占的比例,记为 p
随机取出 n 个样本,记符合条件的数量
Sn=#{Xi∣Xi∈A,i=1,2,…,n}
则显然 Sn∼B(n,p),其样本比例 p^=nSn 的期望为 p,方差为 \frac{p(1-p)}
利用中心极限定理章节的 De Moivre–Laplace 定理可以知道,在 n 足够大时
Z=p(1−p)/np^−p∼N(0,1)
所以问题转回标准正态分布
P(−zα/2≤Z≤zα/2)=1−α
代入 Z 的表达式,得到
P(p^−zα/2np(1−p)≤p≤p^+zα/2np(1−p))≈1−α
虽然总体比例 p 未知,但是在大样本下,可以用样本比例 p^ 近似替代标准误中的 p(Slutsky 定理),此时置信区间为
[p^−zα/2np^(1−p^),p^+zα/2np^(1−p^)]
# 估计总体平均之差(已知总体方差)
核心是借由正态分布的四则性质
考虑两个服从正态分布的总体 N(μ1,σ12) 和 N(μ2,σ22),其中 σ12 和 σ22 已知,目标是推测总体平均之差 μ1−μ2
分别取样本 X1,X2,…,Xn1 和 Y1,Y2,…,Yn2,则
Z=n1σ12+n2σ22(Xn1−Yn2)−(μ1−μ2)∼N(0,1)
同样根据标准正态分布
P(−zα/2≤Z≤zα/2)=1−α
解出 μ1−μ2 的置信区间为
⎣⎢⎡(Xn1−Yn2)−zα/2n1σ12+n2σ22,(Xn1−Yn2)+zα/2n1σ12+n2σ22⎦⎥⎤
# 估计总体平均之差(未知总体方差)
核心是利用 t 分布,但需根据两总体方差是否相等分为两种情况
# 情形 1:假设方差相等 σ12=σ22=σ2
此时可以将两组样本的方差合并,计算 合并方差 (Pooled Variance)
Sp2=n1+n2−2(n1−1)S12+(n2−1)S22
构造统计量
t=Spn11+n21(Xn1−Yn2)−(μ1−μ2)∼t(n1+n2−2)
置信区间为
[(Xn1−Yn2)±tα/2(n1+n2−2)⋅Spn11+n21]
# 情形 2:不假设方差相等 σ12=σ22
此时统计量不再精确服从 t 分布,但可以近似
t=n1S12+n2S22(Xn1−Yn2)−(μ1−μ2)≈t(ν)
其中自由度 ν 由 Welch–Satterthwaite 公式 给出(通常取整)
ν≈n1−1(S12/n1)2+n2−1(S22/n2)2(n1S12+n2S22)2
置信区间为
⎣⎢⎡(Xn1−Yn2)±tα/2(ν)n1S12+n2S22⎦⎥⎤
# 估计总体方差(已知总体平均)
核心是利用卡方分布
考虑服从正态分布的总体 N(μ,σ2),其中 μ 已知,目标是推测总体方差 σ2
取样本 X1,X2,…,Xn,则
χ2=σ2∑i=1n(Xi−μ)2∼χ2(n)
注意:此处因为 μ 已知,没有消耗自由度,故为 n
利用卡方分布表,查出两侧 α 分位点 χ1−α/22(n) 和 χα/22(n)(注意卡方分布不对称),则有
P(χ1−α/22(n)≤χ2≤χα/22(n))=1−α
代入 χ2 的表达式,置信区间为
[χα/22(n)∑i=1n(Xi−μ)2,χ1−α/22(n)∑i=1n(Xi−μ)2]
# 估计总体方差(未知总体平均)
核心是 Fisher-Cochran 定理
定理 Fisher-Cochran 定理
对于来自正态总体 N(μ,σ2) 的样本 X1,X2,…,Xn
σ2∑i=1n(Xi−Xn)2=σ2(n−1)S2∼χ2(n−1)
且 (n−1)S2 与 Xn 相互独立
利用此定理,可以实现不使用总体平均的前提下估计总体方差
取样本 X1,X2,…,Xn,则
χ2=σ2(n−1)S2∼χ2(n−1)
利用卡方分布表,查出两侧 α 分位点 χ1−α/22(n−1) 和 χα/22(n−1),则有
P(χ1−α/22(n−1)≤χ2≤χα/22(n−1))=1−α
代入 χ2 的表达式,得到 σ2 的置信区间为
[χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2]
内容已经过 Gemini 3.0 Pro 审查