统计学本质上的目的是去尽可能精确的估计总体的参数
例如我们想要研究全球人类的平均身高
最常见的方法就是随机抽取大量样本,然后进行估算
假设总体的平均身高为 μ\mu,抽取标本 X1,X2,,XnX_1, X_2, \ldots, X_n,计算标本的平均身高 X=1ni=1nXi\overline{X} = \frac{1}{n}\sum\limits_{i=1}^n X_i
自然我们期待 X\overline{X} 能够尽可能接近 μ\mu

但是注意:标本平均也是一个随机变量,也就是说,固定取 nn 个标本的时候,每次取的那一组标本算出来的标本平均是不太一样的
所以标本平均自己也拥有一个概率分布
有必要考察在标本量足够大的情况下,标本平均的分布情况

本章主要为以下两个内容

  • 大数定律:当标本量足够大时,标本平均趋近于总体平均
  • 中心极限定理:当标本量足够大时,标本平均的分布趋近于正态分布

# 大数定律

定理 大数定律
X1,X2,,XnX_1, X_2, \ldots, X_n 为来自总体 XXnn 个独立同分布的随机变量,且

Xn=1ni=1nXi\overline{X}_n = \frac{1}{n}\sum\limits_{i=1}^n X_i

则对于任意 ε>0\varepsilon > 0,有

limnP(Xnμε)=0\lim_{n \to \infty} P(|\overline{X}_n - \mu| \geq \varepsilon) = 0

# 中心极限定理

定理 中心极限定理
X1,X2,,XnX_1, X_2, \ldots, X_n 为来自总体 XXnn 个独立同分布的随机变量,且