本章对几个常见的抽样分布进行介绍
需要明确的是，抽样分布本质上还是概率分布
重点在于如何做出服从对应抽样分布的统计量，并以此进行计算

# 卡方分布

对于自然数 $n$ ，由

$f_n(x) = \begin{cases} \displaystyle\frac{1}{2^{n/2} \Gamma(n/2)} x^{n/2-1} e^{-x/2}, & x \gt 0 \\ 0, & \text{otherwise} \end{cases}$

给出的概率分布称为自由度 $n$ 的 卡方分布 (Chi-Squared Distribution)「カイ二乗分布」，记为 $\chi^2(n)$

其中

$\Gamma(t) = \int_0^{+\infty} x^{t-1} e^{-x} \, dx$

为 Gamma 函数，满足 $\Gamma(t+1) = t\Gamma(t)$ 以及 \Gamma(1/2) = \sqrt

命题
对于 $\chi^2(n)$ 分布

期望值 $E[\chi^2] = n$
方差 $V[\chi^2] = 2n$
矩母函数 $M_{\chi^2}(t) = (1 - 2t)^{-n/2}$ ， $t \lt \frac{1}{2} \quad$

证明

概率良定性

$\int_0^{+\infty} f_n(x) \, dx = \frac{1}{2^{n/2} \Gamma(n/2)} \int_0^{+\infty} x^{n/2 - 1} e^{-x/2} \, dx$

令 $y = \frac{x}{2}$ ，则 $x = 2y$ ， $dx = 2 dy$

$= \frac{1}{2^{n/2} \Gamma(n/2)} \int_0^{+\infty} (2y)^{n/2 - 1} e^{-y} \cdot 2 \, dy = \frac{2^{n/2}}{2^{n/2} \Gamma(n/2)} \int_0^{+\infty} y^{n/2 - 1} e^{-y} \, dy = \frac{\Gamma(n/2)}{\Gamma(n/2)} = 1$

矩母函数

$M_{\chi^2}(t) = E[e^{t \chi^2}] = \int_0^{+\infty} e^{t x} f_n(x) \, dx = \frac{1}{2^{n/2} \Gamma(n/2)} \int_0^{+\infty} x^{n/2 - 1} e^{-x/2 + t x} \, dx$

令 $u = \left(\frac{1}{2} - t\right) x$ ，则 $x = \frac{u}{\frac{1}{2} - t}$ ， $dx = \frac{du}{\frac{1}{2} - t}$

$= \frac{1}{2^{n/2} \Gamma(n/2)} \int_0^{+\infty} \left(\frac{u}{\frac{1}{2} - t}\right)^{n/2 - 1} e^{-u} \cdot \frac{du}{\frac{1}{2} - t} = \frac{1}{2^{n/2} \Gamma(n/2)} \cdot \frac{1}{\left(\frac{1}{2} - t\right)^{n/2}} \int_0^{+\infty} u^{n/2 - 1} e^{-u} \, du = \frac{1}{2^{n/2} \Gamma(n/2)} \cdot \frac{1}{\left(\frac{1}{2} - t\right)^{n/2}} \Gamma\left(\frac{n}{2}\right) = (1 - 2t)^{-n/2}$

期望值

$E[\chi^2] = M_{\chi^2}'(0) = \left. \frac{n}{2} (1 - 2t)^{-n/2 - 1} \cdot 2 \right|_{t=0} = n$

方差

$E[\chi^4] = M_{\chi^2}''(0) = \left. \frac{n(n+2)}{4} (1 - 2t)^{-n/2 - 2} \cdot 4 \right|_{t=0} = n(n+2)$

$V[\chi^2] = E[\chi^4] - (E[\chi^2])^2 = n(n+2) - n^2 = 2n$

$\square$

命题
自由度 $n$ 的 $\chi^2$ 分布实际上是 Gamma 分布 $\Gamma\left(\frac{n}{2}, 2\right)$ （形状参数 $n/2$ ，尺度参数 $2$ ）

统计量的构造

命题
若 $\boldsymbol X \sim N(\boldsymbol 0, E_n)$ ，即 $n$ 个随机变量独立同分布于标准正态分布，令

$\chi^2 = \sum_{i=1}^n X_i^2$

则 $\chi^2 \sim \chi^2(n)$

证明

由于 $X_i \sim N(0,1)$ ，其平方 $X_i^2$ 的矩母函数为：

$M_{X_i^2}(t) = E[e^{tX_i^2}] = \int_{-\infty}^\infty e^{tx^2} \frac{1}{\sqrt{2\pi}}e^{-x^2/2} dx = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^\infty e^{-\frac{1-2t}{2}x^2} dx = (1-2t)^{-1/2}$

由于 $X_i$ 相互独立，和的矩母函数等于矩母函数的积：

$M_{\sum X_i^2}(t) = \prod_{i=1}^n (1-2t)^{-1/2} = (1-2t)^{-n/2}$

这正是 $\chi^2(n)$ 的矩母函数。
$\square$

性质上，若 $\chi^2_1 \sim \chi^2(n_1)$ ， $\chi^2_2 \sim \chi^2(n_2)$ 且 $\chi^2_1, \chi^2_2$ 独立，则有

$\chi^2_1 + \chi^2_2 \sim \chi^2(n_1 + n_2)$

基于标准正态分布的制作方法，可以推广到 $N(\mu, \sigma^2)$ ，令

$\chi^2 = \sum_{i=1}^n \left(\frac{X_i - \mu}{\sigma}\right)^2$

则 $\chi^2 \sim \chi^2(n)$

此外，由于总平均 $\mu$ 往往未知，所以应用上最常用和关键的制作方法是令

$\chi^2 = \sum_{i=1}^n \left(\frac{X_i - \overline X_n}{\sigma}\right)^2 = \frac{(n-1)S^2}{\sigma^2}$

则 $\chi^2 \sim \chi^2(n-1)$

注意：自由度从 $n$ 变为 $n-1$ ，是因为样本均值 $\overline{X}$ 的计算引入了一个线性约束 $\sum (X_i - \overline{X}) = 0$ ，消耗了一个自由度（Cochran 定理）

# F 分布

对于自然数 $m,n$ ，由

$f_{m,n}(x) = \begin{cases} \displaystyle\frac{m^{m/2} n^{n/2}}{B(m/2, n/2)} \frac{x^{m/2 - 1}}{(mx + n)^{(m+n)/2}}, & x > 0 \\ 0, & \text{otherwise} \end{cases}$

给出的概率分布称为分子自由度 $m$ ，分母自由度 $n$ 的 F 分布 (F Distribution)「F 分布」，记为 $F(m,n)$
其中 $B(p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)}$ 为 Beta 函数

命题
对于 $F(m, n)$ 分布

期望值 $E[F] = \dfrac{n}{n-2}$ ， $n \gt 2$
方差 $V[F] = \dfrac{2 n^2 (m+n-2)}{m (n-2)^2 (n-4)}$ ， $n \gt 4$

证明

直接对 PDF 进行积分非常繁琐。利用 $F$ 分布的构造定义证明更为简洁。
由定义知，若 $U \sim \chi^2(m), V \sim \chi^2(n)$ 且独立，则 $F = \frac{U/m}{V/n}$ 。
先计算 $\chi^2(k)$ 的倒数期望。设 $Y \sim \chi^2(k)$ ：

$E[Y^r] = \int_0^\infty x^r \frac{1}{2^{k/2}\Gamma(k/2)} x^{k/2-1} e^{-x/2} dx = \frac{2^r \Gamma(k/2+r)}{\Gamma(k/2)}$

所以

$E[V^{-1}] = \frac{2^{-1} \Gamma(n/2-1)}{\Gamma(n/2)} = \frac{1}{2} \frac{1}{n/2 - 1} = \frac{1}{n-2} \quad (n>2)$

$E[V^{-2}] = \frac{2^{-2} \Gamma(n/2-2)}{\Gamma(n/2)} = \frac{1}{4} \frac{1}{(n/2-1)(n/2-2)} = \frac{1}{(n-2)(n-4)} \quad (n>4)$

期望值
由于 $U, V$ 独立

$E[F] = \frac{n}{m} E[U] E[V^{-1}] = \frac{n}{m} \cdot m \cdot \frac{1}{n-2} = \frac{n}{n-2}$

方差

$E[F^2] = \frac{n^2}{m^2} E[U^2] E[V^{-2}]$

已知 $E[U^2] = V[U] + (E[U])^2 = 2m + m^2 = m(m+2)$

$E[F^2] = \frac{n^2}{m^2} \cdot m(m+2) \cdot \frac{1}{(n-2)(n-4)} = \frac{n^2(m+2)}{m(n-2)(n-4)}$

$V[F] = E[F^2] - (E[F])^2 = \frac{n^2(m+2)}{m(n-2)(n-4)} - \left(\frac{n}{n-2}\right)^2$

通分整理后得

$V[F] = \frac{2 n^2 (m+n-2)}{m (n-2)^2 (n-4)}$

$\square$

统计量的构造

命题
若 $\chi^2_1 \sim \chi^2(m)$ ， $\chi^2_2 \sim \chi^2(n)$ 且 $\chi^2_1, \chi^2_2$ 独立，令

$F = \frac{\chi^2_1 / m}{\chi^2_2 / n}$

则 $F \sim F(m,n)$

一般地
从服从正态分布 $N(\mu_1, \sigma_1^2)$ 的总体中抽取 $m$ 个样本 $X_1, \ldots, X_m$
从服从正态分布 $N(\mu_2, \sigma_2^2)$ 的总体中抽取 $n$ 个样本 $Y_1, \ldots, Y_n$ ，令

$F = \frac{S_X^2 / \sigma_1^2}{S_Y^2 / \sigma_2^2}$

则 $F \sim F(m-1, n-1)$

其中 $S_X^2, S_Y^2$ 为样本的无偏方差（分母为 $n-1$ ）

# t 分布

对于自然数 $n$ ，由

$f_n(x) = \frac{1}{\sqrt{n} B\left(\frac{n}{2}, \frac{1}{2}\right)} \left(1 + \frac{x^2}{n}\right)^{-\frac{n+1}{2}},\quad x \in \mathbb R$

给出的概率分布称为自由度 $n$ 的 t 分布 (Student's t-Distribution)「t 分布」，记为 $t(n)$

命题
对于 $t(n)$ 分布

期望值 $E[t] = 0$ ， $n \gt 1$
方差 $V[t] = \dfrac{n}{n-2}$ ， $n \gt 2$

证明

利用 $t$ 分布的构造定义证明。
由定义知，若 $Z \sim N(0,1), V \sim \chi^2(n)$ 且独立，则 $t = \frac{Z}{\sqrt{V/n}}$ 。

期望值
由于 $Z$ 与 $V$ 独立，且 $E[Z]=0$

$E[t] = E[Z] E\left[\frac{1}{\sqrt{V/n}}\right] = 0 \cdot E\left[\frac{1}{\sqrt{V/n}}\right] = 0$

方差

$V[t] = E[t^2] - (E[t])^2 = E\left[\frac{Z^2}{V/n}\right] - 0 = n E[Z^2] E[V^{-1}]$

已知 $E[Z^2] = V[Z] + (E[Z])^2 = 1$ ，且此前已证 E[V^{-1}] = \frac{1}

$V[t] = n \cdot 1 \cdot \frac{1}{n-2} = \frac{n}{n-2}$

$\square$

统计量的构造

命题
若 $Z \sim N(0,1)$ ， $\chi^2 \sim \chi^2(n)$ 且 $Z, \chi^2$ 独立，令

$t = \frac{Z}{\sqrt{\chi^2 / n}}$

则 $t \sim t(n)$
特别地，令

$t^2 = \frac{Z^2}{\chi^2 / n} \sim F(1,n)$

一般地，从服从正态分布 $N(\mu, \sigma^2)$ 的总体中抽取 $n$ 个样本 $X_1, X_2, \ldots, X_n$ ，令

$t = \frac{\overline X_n - \mu}{S / \sqrt{n}}$

则 $t \sim t(n-1)$

其中 $S$ 为样本无偏标准差（分母为 $n-1$ ）

内容已经过 Gemini 3.0 Pro 审查

# 卡方分布

# F 分布

# t 分布

【数理统计】7-推断统计

【数理统计】5-样本与中心极限定理