# 二项分布

# 定义

记事件 AAnn 次实验中发生 kk 次的概率为 P(X=k)P(X=k)

则此时随机变量 XX 的分布称为 二项分布 (Binomial Distribution)「二項分布」,记为 XB(n,p)X \sim B(n,p)

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

其中 (nk)=n!k!(nk)!\binom{n}{k} = \frac{n!}{k!(n-k)!} 为组合数

二项分布的

  • 期望值 E[X]=npE[X] = np
  • 方差 V[X]=np(1p)V[X] = np(1-p)
  • 矩母函数 MX(t)=E[etX]=(pet+1p)nM_X(t) = E[e^{tX}] = (pe^t + 1 - p)^n

# 分布例题

示例
某个工厂生产的零件有 3%3\% 的次品率,现从中随机抽取 1010 个零件,求其中恰好有 22 个次品的概率

设随机变量 XX 表示抽取的 1010 个零件中次品的个数,则 XB(10,0.03)X \sim B(10, 0.03)

P(X=2)=(102)(0.03)2(0.97)80.0746P(X=2) = \binom{10}{2} (0.03)^2 (0.97)^8 \approx 0.0746

# 计算推导过程

概率

每次成功的概率为 pp,失败的概率为 1p1-p
nn 次实验中恰好有 kk 次成功的概率为
kk 个成功乘以 nkn-k 个失败

pk(1p)nkp^k (1-p)^{n-k}

kk 次成功可以出现在 nn 次实验中的任意位置,共有 (nk)\binom{n}{k} 种情况
所以总概率为重复独立地同一实验 nn 次,其中某事件 AA 每次发生的概率为 pp

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

检查全概率和

k=0nP(X=k)=k=0n(nk)pk(1p)nk=(p+1p)n=1\sum\limits_{k=0}^n P(X=k) = \sum\limits_{k=0}^n \binom{n}{k} p^k (1-p)^{n-k} = (p + 1 - p)^n = 1

期望值

E[X]=k=0nkP(X=k)=k=0nk(nk)pk(1p)nk=k=1nkn!k!(nk)!pk(1p)nk=k=1nn!(k1)!(nk)!pk(1p)nk=npk=1n(n1)!(k1)!(nk)!pk1(1p)(n1)(k1)=npj=0n1(n1j)pj(1p)(n1)j=np(p+1p)n1=np\begin{aligned} E[X] &= \sum\limits_{k=0}^n k P(X=k) \\ &= \sum\limits_{k=0}^n k \binom{n}{k} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=1}^n k \frac{n!}{k!(n-k)!} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=1}^n \frac{n!}{(k-1)!(n-k)!} p^k (1-p)^{n-k} \\ &= np \sum\limits_{k=1}^n \frac{(n-1)!}{(k-1)!(n-k)!} p^{k-1} (1-p)^{(n-1)-(k-1)} \\ &= np \sum\limits_{j=0}^{n-1} \binom{n-1}{j} p^j (1-p)^{(n-1)-j} \\ &= np (p + 1 - p)^{n-1} \\ &= np \end{aligned}

方差

V[X]=E[(XE[X])2]=E[X2](E[X])2=k=0nk2P(X=k)(np)2=k=0nk2(nk)pk(1p)nk(np)2=k=1nk2n!k!(nk)!pk(1p)nk(np)2=k=1nkn!(k1)!(nk)!pk(1p)nk(np)2=npk=1nk(n1)!(k1)!(nk)!pk1(1p)(n1)(k1)(np)2=npj=0n1(j+1)(n1j)pj(1p)(n1)j(np)2=np(j=0n1j(n1j)pj(1p)(n1)j+j=0n1(n1j)pj(1p)(n1)j)(np)2=np((n1)p+1)(np)2=np(1p)\begin{aligned} V[X] &= E[(X - E[X])^2] \\ &= E[X^2] - (E[X])^2 \\ &= \sum\limits_{k=0}^n k^2 P(X=k) - (np)^2 \\ &= \sum\limits_{k=0}^n k^2 \binom{n}{k} p^k (1-p)^{n-k} - (np)^2 \\ &= \sum\limits_{k=1}^n k^2 \frac{n!}{k!(n-k)!} p^k (1-p)^{n-k} - (np)^2 \\ &= \sum\limits_{k=1}^n k \frac{n!}{(k-1)!(n-k)!} p^k (1-p)^{n-k} - (np)^2 \\ &= np \sum\limits_{k=1}^n k \frac{(n-1)!}{(k-1)!(n-k)!} p^{k-1} (1-p)^{(n-1)-(k-1)} - (np)^2 \\ &= np \sum\limits_{j=0}^{n-1} (j+1) \binom{n-1}{j} p^j (1-p)^{(n-1)-j} - (np)^2 \\ &= np \left( \sum\limits_{j=0}^{n-1} j \binom{n-1}{j} p^j (1-p)^{(n-1)-j} + \sum\limits_{j=0}^{n-1} \binom{n-1}{j} p^j (1-p)^{(n-1)-j} \right) - (np)^2 \\ &= np \left( (n-1)p + 1 \right) - (np)^2 \\ &= np(1-p) \end{aligned}

矩母函数

MX(t)=E[etX]=k=0netkP(X=k)=k=0netk(nk)pk(1p)nk=k=0n(nk)(pet)k(1p)nk=(pet+1p)n\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=0}^n e^{tk} P(X=k) \\ &= \sum\limits_{k=0}^n e^{tk} \binom{n}{k} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=0}^n \binom{n}{k} (pe^t)^k (1-p)^{n-k} \\ &= (pe^t + 1 - p)^n \end{aligned}

# Poisson 分布

# 定义

在二项分布中,如果实验量 nn 很大,会使得实际计算变成复杂
所以在二项分布的基础上,如果令 n,p0n \to \infty, p \to 0np=λnp = \lambda 始终保持为常数

那么此时随机变量 XX 的分布称为 Poisson 分布 (Poisson Distribution)「ポアソン分布」,记为 XP(λ)X \sim P(\lambda)

P(X=k)=λkeλk!P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}

Poisson 分布主要应用在单位时间或单位面积这种基本上不能离散化的场景中

Poisson 分布的

  • 期望值 E[X]=λE[X] = \lambda
  • 方差 V[X]=λV[X] = \lambda
  • 矩母函数 MX(t)=E[etX]=eλ(et1)M_X(t) = E[e^{tX}] = e^{\lambda(e^t - 1)} \quad

# 分布例题

示例
已知某个路口每小时平均有 33 辆车经过,求在 11 小时内恰好有 55 辆车经过的概率

设随机变量 XX 表示在 11 小时内经过的车辆数,则 XP(3)X \sim P(3)

P(X=5)=35e35!0.1008P(X=5) = \frac{3^5 e^{-3}}{5!} \approx 0.1008

# 计算推导过程

概率

由于 Poisson 分布是基于二项分布的,所以首先有

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

此处代入 p=λnp = \frac{\lambda}{n} \quad

P(X=k)=(nk)(λn)k(1λn)nkP(X=k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k}

nn \to \infty

n!nk(nk)!=(11n)(12n)(1k1n)1\frac{n!}{n^k(n-k)!} = (1 - \frac{1}{n})(1 - \frac{2}{n}) \cdots (1 - \frac{k-1}{n}) \to 1

(1λn)neλ(1 - \frac{\lambda}{n})^n \to e^{-\lambda}

所以当 0k0 \leq k 被固定的时候

limn(nk)(λn)k(1λn)nk=λkeλk!\lim\limits_{n \to \infty} \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}

检查全概率和

k=0P(X=k)=k=0λkeλk!=eλk=0λkk!=eλeλ=1\sum\limits_{k=0}^\infty P(X=k) = \sum\limits_{k=0}^\infty \frac{\lambda^k e^{-\lambda}}{k!} = e^{-\lambda} \sum\limits_{k=0}^\infty \frac{\lambda^k}{k!} = e^{-\lambda} e^{\lambda} = 1

期望值

E[X]=k=0kP(X=k)=k=0kλkeλk!=k=1kλkeλk!=k=1λkeλ(k1)!=λeλk=1λk1(k1)!=λeλj=0λjj!=λeλeλ=λ\begin{aligned} E[X] &= \sum\limits_{k=0}^\infty k P(X=k) \\ &= \sum\limits_{k=0}^\infty k \frac{\lambda^k e^{-\lambda}}{k!} \\ &= \sum\limits_{k=1}^\infty k \frac{\lambda^k e^{-\lambda}}{k!} \\ &= \sum\limits_{k=1}^\infty \frac{\lambda^k e^{-\lambda}}{(k-1)!} \\ &= \lambda e^{-\lambda} \sum\limits_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} \\ &= \lambda e^{-\lambda} \sum\limits_{j=0}^\infty \frac{\lambda^j}{j!} \\ &= \lambda e^{-\lambda} e^{\lambda} \\ &= \lambda \end{aligned}

方差

V[X]=E[(XE[X])2]=E[X2](E[X])2=k=0k2P(X=k)λ2=k=0k2λkeλk!λ2=k=1k2λkeλk!λ2=k=1kλkeλ(k1)!λ2=λeλk=1kλk1(k1)!λ2=λeλj=0(j+1)λjj!λ2=λeλ(j=0jλjj!+j=0λjj!)λ2=λeλ(λeλ+eλ)λ2=λ(λ+1)λ2=λ\begin{aligned} V[X] &= E[(X - E[X])^2] \\ &= E[X^2] - (E[X])^2 \\ &= \sum\limits_{k=0}^\infty k^2 P(X=k) - \lambda^2 \\ &= \sum\limits_{k=0}^\infty k^2 \frac {\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum\limits_{k=1}^\infty k^2 \frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum\limits_{k=1}^\infty k \frac{\lambda^k e^{-\lambda}}{(k-1)!} - \lambda^2 \\ &= \lambda e^{-\lambda} \sum\limits_{k=1}^\infty k \frac{\lambda^{k-1}}{(k-1)!} - \lambda^2 \\ &= \lambda e^{-\lambda} \sum\limits_{j=0}^\infty (j+1) \frac{\lambda^j}{j!} - \lambda^2 \\ &= \lambda e^{-\lambda} \left( \sum\limits_{j=0}^\infty j \frac{\lambda^j}{j!} + \sum\limits_{j=0}^\infty \frac{\lambda^j}{j!} \right) - \lambda^2 \\ &= \lambda e^{-\lambda} (\lambda e^{\lambda} + e^{\lambda}) - \lambda^2 \\ &= \lambda (\lambda + 1) - \lambda^2 \\ &= \lambda \end{aligned} \quad

矩母函数

MX(t)=E[etX]=k=0etkP(X=k)=k=0etkλkeλk!=eλk=0(λet)kk!=eλeλet=eλ(et1)\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=0}^\infty e^{tk} P(X=k) \\ &= \sum\limits_{k=0}^\infty e^{tk} \frac{\lambda^k e^{-\lambda}}{k!} \\ &= e^{-\lambda} \sum\limits_{k=0}^\infty \frac{(\lambda e^t)^k}{k!} \\ &= e^{-\lambda} e^{\lambda e^t} \\ &= e^{\lambda (e^t - 1)} \end{aligned}

# 几何分布

# 定义

重复独立地同一实验 nn 次,其中某事件 AA 每次发生的概率为 pp
记事件 AA 在第 kk 次实验中首次发生的概率为 P(X=k)P(X=k)

则此时随机变量 XX 的分布称为 几何分布 (Geometric Distribution)「幾何分布」,记为 XG(p)X \sim G(p)

P(X=k)=(1p)k1pP(X=k) = (1-p)^{k-1} p

几何分布的

  • 期望值 E[X]=1pE[X] = \frac{1}{p} \quad
  • 方差 V[X]=1pp2V[X] = \frac{1-p}{p^2} \quad
  • 矩母函数 MX(t)=E[etX]=pet1(1p)et,t<ln(1p)M_X(t) = E[e^{tX}] = \frac{pe^t}{1 - (1-p)e^t},\quad t < -\ln(1-p)

# 分布例题

示例
某抽卡游戏中,抽到 SSR 的概率为 0.6%0.6\%,求抽一百次后能出 SSR 的概率,以及平均需要抽多少次才能抽到 SSR (不考虑保底机制)

设随机变量 XX 表示抽到 SSR 所需的次数,则 XG(0.006)X \sim G(0.006)

P(X100)=k=1100(10.006)k1×0.006=1(10.006)1000.4512P(X \leq 100) = \sum\limits_{k=1}^{100} (1-0.006)^{k-1} \times 0.006 = 1 - (1-0.006)^{100} \approx 0.4512

所以抽一百次后能出 SSR 的概率约为 45.12%45.12\%

E[X]=10.006166.67E[X] = \frac{1}{0.006} \approx 166.67

平均需要抽 167167 次才能抽到 SSR

# 计算推导过程

概率

每次失败的概率为 1p1-p,在前 k1k-1 次实验中均失败,第 kk 次实验成功,所以直接用乘积得到概率

(1p)k1p(1-p)^{k-1} p

检查全概率和

k=1P(X=k)=k=1(1p)k1p=pk=0(1p)k=p11(1p)=1\sum\limits_{k=1}^\infty P(X=k) = \sum\limits_{k=1}^\infty (1-p)^{k-1} p = p \sum\limits_{k=0}^\infty (1-p)^k = p \cdot \frac{1}{1-(1-p)} = 1

期望值

E[X]=k=1kP(X=k)=k=1k(1p)k1p=pk=1k(1p)k1=p1(1(1p))2=1p\begin{aligned} E[X] &= \sum\limits_{k=1}^\infty k P(X=k) \\ &= \sum\limits_{k=1}^\infty k (1-p)^{k-1} p \\ &= p \sum\limits_{k=1}^\infty k (1-p)^{k-1} \\ &= p \cdot \frac{1}{(1-(1-p))^2} \\ &= \frac{1}{p} \end{aligned}

方差

V[X]=E[X2](E[X])2=pk=1k2(1p)k1(1p)2=p1+(1p)(1(1p))31p2=1pp2\begin{aligned} V[X] &= E[X^2] - (E[X])^2 \\ &= p \sum\limits_{k=1}^\infty k^2 (1-p)^{k-1} - \left(\frac{1}{p}\right)^2 \\ &= p \cdot \frac{1+(1-p)}{(1-(1-p))^3} - \frac{1}{p^2} \\ &= \frac{1-p}{p^2} \end{aligned}

矩母函数

MX(t)=E[etX]=k=1etkP(X=k)=k=1etk(1p)k1p=pet1(1p)et,t<ln(1p)\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=1}^\infty e^{tk} P(X=k) \\ &= \sum\limits_{k=1}^\infty e^{tk} (1-p)^{k-1} p \\ &= p \cdot \frac{e^{t}}{1-(1-p)e^{t}},\quad t < -\ln(1-p) \end{aligned}