统计学本质上的目的是去尽可能精确的估计总体的参数
例如我们想要研究全球人类的平均身高
最常见的方法就是随机抽取大量样本,然后进行估算
假设总体的平均身高为 μ\mu,抽取样本 X1,X2,,XnX_1, X_2, \ldots, X_n,计算样本的平均身高 X=1ni=1nXi\overline{X} = \frac{1}{n}\sum\limits_{i=1}^n X_i
自然我们期待 X\overline{X} 能够尽可能接近 μ\mu

但是注意:样本平均也是一个随机变量,也就是说,固定取 nn 个样本的时候,每次取的那一组样本算出来的样本平均是不太一样的
所以样本平均自己也拥有一个概率分布
有必要考察在样本量足够大的情况下,样本平均的分布情况

本章主要为以下两个内容

  • 大数定律:当样本量足够大时,样本平均趋近于总体平均
  • 中心极限定理:当样本量足够大时,样本平均的分布趋近于正态分布

# 大数定律

定理 大数定律
X1,X2,,XnX_1, X_2, \ldots, X_n 为来自总体 XXnn 个独立同分布的随机变量,且

Xn=1ni=1nXi\overline{X}_n = \frac{1}{n}\sum\limits_{i=1}^n X_i

则对于任意 ε>0\varepsilon > 0,有

limnP(Xnμε)=0\lim_{n \to \infty} P(|\overline{X}_n - \mu| \geq \varepsilon) = 0

# 中心极限定理

定理 中心极限定理
X1,X2,,XnX_1, X_2, \ldots, X_n 为来自总体 XXnn 个独立同分布的随机变量,且