# 统计检验

拥有标本分布以及中心极限定理这个强大的工具后,我们得以通过区标本的方式来处理未知的总体数据
首先如先前所说,我们本质上在做的是去 “猜” 这个总体的数据,这是不会变的。
但是我们可以明确我们在某个区间上猜对的概率

我们需要先取一个 置信系数 (Confidence Level)「有意水準」 α\alpha,通常来说取 5%5\%1%1\%,表示我们允许有 5%5\%1%1\% 的概率猜错

通过这个置信系数下我们在对原本的总体数据进行估计的时候,会得到一个区间而不是一个值。
这个区间称为 置信区间 (Confidence Interval)「信頼区間」

例如我们对总体平均 μ\mu 进行估计,得到的结果是 [a,b][a,b],表示 μ\mu1α1-\alpha 的概率 μ\mu 落在 [a,b][a,b] 这个区间内

推测统计的魅力就在于此。我们不能下结论说 “μ\mu 是多少多少”,但是我们可以下定结论说 “μ\mu 一定会有 1α1-\alpha 的概率落在 [a,b][a,b] 这个区间内”

对于标准正态分布,置信区间的边界点叫做 α\alpha 点,基于分布类型可能也成为两侧 α\alpha 点,记作 z(α)z(\alpha)zαz_\alpha

标准正态分布的α点

常使用的值:

置信系数 α\alphaz(α)z(\alpha)(两侧)
0.101.645
0.051.960
0.032.170
0.022.326
0.012.576

# 已知总体方差时推测总体平均

在总体分布服从正态分布 N(μ,σ2)N(\mu, \sigma^2),且 σ2\sigma^2 已知的情况下
大量取标本,根据中心极限定理可知标本平均 X\overline{X} 服从正态分布(差不多超过三十个标本就是大量了)

此时

[Xnz(α)σn,Xn+z(α)σn]\left[\overline X_n - z(\alpha) \frac{\sigma}{\sqrt{n}},\ \overline X_n + z(\alpha) \frac{\sigma}{\sqrt{n}}\right]

成为总体平均 μ\mu(1α)%(1-\alpha)\% 置信区间
这意味着对于标准化的随机变量 ZN(0,1)Z \sim N(0,1):

P(z(α)Z=Xnμσ/nz(α))=1αP\left(-z(\alpha) \leq Z = \frac{\overline X_n - \mu}{\sigma/\sqrt{n}} \leq z(\alpha)\right) = 1-\alpha

# 假说检验

首先是概念

  • 原假设 (Null Hypothesis)「帰無仮説」 H0H_0:通常是我们想要反驳的假设
  • 备择假设 (Alternative Hypothesis)「対立仮説」 H1H_1:通常是我们想要证明的假设
  • 检验统计量 (Test Statistic)「検定統計量」 TT:基于标本计算得到的统计量
  • 拒绝域 (Rejection Region)「棄却域」 WW:当检验统计量落在这个区域时,我们拒绝原假设 H0H_0

通常来说,原假设的形式是:【没有差别】,【没有效果】
例如总体平均 μ=100\mu = 100

备择假设的形式是:【有差别】,【有效果】
例如总体平均 μ100,μ<100,μ>100\mu \neq 100,\ \mu < 100,\ \mu > 100

统计假说检验的流程如下:

  • 首先确定原假设 H0H_0 和备择假设 H1H_1
  • 选择显著性水平 α\alpha,通常取 0.050.05
  • 计算检验统计量 ZZ
  • 与原假设下的分布进行比较,进行判定
  • 给出结论:
    • 拒绝 H0H_0,接受 H1H_1
    • 不拒绝 H0H_0,无法接受 H1H_1

以下用两个例题来说明两侧检验和单侧检验

例题 两侧检验
某饮料标称 500ml,现取 36 瓶测得平均容量为 498.5ml
已知总体方差为 9ml29ml^2
问在显著性水平 0.05 下,能否说该饮料容量确实如标称的 500ml?

设定参量
标本量 n=36n = 36
标本平均 X=498.5\overline X = 498.5
总体方差 σ2=9\sigma^2 = 9
宣称平均 μ0=500\mu_0 = 500
显著性水平 α=0.05\alpha = 0.05 (两侧)
原假设 H0:μ=500H_0: \mu = 500
备择假设 H1:μ500H_1: \mu \neq 500
计算检验统计量

Z=Xμ0σ/n=498.55003/6=3Z = \frac{\overline X - \mu_0}{\sigma/\sqrt{n}} = \frac{498.5 - 500}{3/6} = -3

α=0.05\alpha = 0.05 下,z(α/2)=1.960z(\alpha/2) = 1.960
由于 Z=3>1.960|Z| = 3 > 1.960,落在拒绝域内
所以拒绝原假设 H0H_0,接受备择假设 H1H_1
结论:在显著性水平 0.05 下,能说该饮料容量确实不如标称的 500ml

例题 单侧检验
某饮料标称 500ml,现取 36 瓶测得平均容量为 498.5ml
已知总体方差为 9ml29ml^2
问在显著性水平 0.05 下,能否说该饮料容量确实大于 500ml?

设定参量
标本量 n=36n = 36
标本平均 X=498.5\overline X = 498.5
总体方差 σ2=9\sigma^2 = 9
宣称平均 μ0=500\mu_0 = 500
显著性水平 α=0.05\alpha = 0.05 (单侧)
原假设 H0:μ500H_0: \mu \leq 500
备择假设 H1:μ>500H_1: \mu > 500
计算检验统计量

Z=Xμ0σ/n=498.55003/6=3Z = \frac{\overline X - \mu_0}{\sigma/\sqrt{n}} = \frac{498.5 - 500}{3/6} = -3

α=0.05\alpha = 0.05 下,z(α)=1.645z(\alpha) = 1.645
由于 Z=3<1.645Z = -3 < 1.645,不落在拒绝域内
所以不拒绝原假设 H0H_0,无法接受备择假设 H1H_1
结论:在显著性水平 0.05 下,不能说该饮料容量确实大于 500ml

所以可以明白,单侧和两侧的区别在于显著性水平的影响和拒绝域的不同