# 统计检验
拥有标本分布以及中心极限定理这个强大的工具后,我们得以通过区标本的方式来处理未知的总体数据
首先如先前所说,我们本质上在做的是去 “猜” 这个总体的数据,这是不会变的。
但是我们可以明确我们在某个区间上猜对的概率
我们需要先取一个 置信系数 (Confidence Level)「有意水準」 α,通常来说取 5% 或 1%,表示我们允许有 5% 或 1% 的概率猜错
通过这个置信系数下我们在对原本的总体数据进行估计的时候,会得到一个区间而不是一个值。
这个区间称为 置信区间 (Confidence Interval)「信頼区間」
例如我们对总体平均 μ 进行估计,得到的结果是 [a,b],表示 μ 有 1−α 的概率 μ 落在 [a,b] 这个区间内
推测统计的魅力就在于此。我们不能下结论说 “μ 是多少多少”,但是我们可以下定结论说 “μ 一定会有 1−α 的概率落在 [a,b] 这个区间内”
对于标准正态分布,置信区间的边界点叫做 α 点,基于分布类型可能也成为两侧 α 点,记作 z(α) 或 zα
![标准正态分布的α点]()
常使用的值:
置信系数 α | z(α)(两侧) |
---|
0.10 | 1.645 |
0.05 | 1.960 |
0.03 | 2.170 |
0.02 | 2.326 |
0.01 | 2.576 |
# 已知总体方差时推测总体平均
在总体分布服从正态分布 N(μ,σ2),且 σ2 已知的情况下
大量取标本,根据中心极限定理可知标本平均 X 服从正态分布(差不多超过三十个标本就是大量了)
此时
[Xn−z(α)nσ, Xn+z(α)nσ]
成为总体平均 μ 的 (1−α)% 置信区间
这意味着对于标准化的随机变量 Z∼N(0,1):
P(−z(α)≤Z=σ/nXn−μ≤z(α))=1−α
# 假说检验
首先是概念
- 原假设 (Null Hypothesis)「帰無仮説」 H0:通常是我们想要反驳的假设
- 备择假设 (Alternative Hypothesis)「対立仮説」 H1:通常是我们想要证明的假设
- 检验统计量 (Test Statistic)「検定統計量」 T:基于标本计算得到的统计量
- 拒绝域 (Rejection Region)「棄却域」 W:当检验统计量落在这个区域时,我们拒绝原假设 H0
通常来说,原假设的形式是:【没有差别】,【没有效果】
例如总体平均 μ=100
备择假设的形式是:【有差别】,【有效果】
例如总体平均 μ=100, μ<100, μ>100
统计假说检验的流程如下:
- 首先确定原假设 H0 和备择假设 H1
- 选择显著性水平 α,通常取 0.05
- 计算检验统计量 Z
- 与原假设下的分布进行比较,进行判定
- 给出结论:
- 拒绝 H0,接受 H1
- 不拒绝 H0,无法接受 H1
以下用两个例题来说明两侧检验和单侧检验
例题 两侧检验
某饮料标称 500ml,现取 36 瓶测得平均容量为 498.5ml
已知总体方差为 9ml2
问在显著性水平 0.05 下,能否说该饮料容量确实如标称的 500ml?
解
设定参量
标本量 n=36
标本平均 X=498.5
总体方差 σ2=9
宣称平均 μ0=500
显著性水平 α=0.05 (两侧)
原假设 H0:μ=500
备择假设 H1:μ=500
计算检验统计量
Z=σ/nX−μ0=3/6498.5−500=−3
在 α=0.05 下,z(α/2)=1.960
由于 ∣Z∣=3>1.960,落在拒绝域内
所以拒绝原假设 H0,接受备择假设 H1
结论:在显著性水平 0.05 下,能说该饮料容量确实不如标称的 500ml
例题 单侧检验
某饮料标称 500ml,现取 36 瓶测得平均容量为 498.5ml
已知总体方差为 9ml2
问在显著性水平 0.05 下,能否说该饮料容量确实大于 500ml?
解
设定参量
标本量 n=36
标本平均 X=498.5
总体方差 σ2=9
宣称平均 μ0=500
显著性水平 α=0.05 (单侧)
原假设 H0:μ≤500
备择假设 H1:μ>500
计算检验统计量
Z=σ/nX−μ0=3/6498.5−500=−3
在 α=0.05 下,z(α)=1.645
由于 Z=−3<1.645,不落在拒绝域内
所以不拒绝原假设 H0,无法接受备择假设 H1
结论:在显著性水平 0.05 下,不能说该饮料容量确实大于 500ml
所以可以明白,单侧和两侧的区别在于显著性水平的影响和拒绝域的不同