本节介绍数个常见的概率分布

  • 离散型
    • 二项分布
    • Poisson 分布
    • 几何分布
  • 连续型
    • 均匀分布
    • 指数分布
    • 正态分布

# 二项分布

记事件 AAnn 次实验中发生 kk 次的概率为 P(X=k)P(X=k)
则此时随机变量 XX 的分布称为 二项分布 (Binomial Distribution)「二項分布」,记为 XB(n,p)X \sim B(n,p)

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

其中 (nk)=n!k!(nk)!\binom{n}{k} = \frac{n!}{k!(n-k)!} 为组合数

命题
二项分布中

  • 期望值 E[X]=npE[X] = np
  • 方差 V[X]=np(1p)V[X] = np(1-p)
  • 矩母函数 MX(t)=E[etX]=(pet+1p)nM_X(t) = E[e^{tX}] = (pe^t + 1 - p)^n
证明

概率良定性
每次成功的概率为 pp,失败的概率为 1p1-p
nn 次实验中恰好有 kk 次成功的概率为
kk 个成功乘以 nkn-k 个失败

pk(1p)nkp^k (1-p)^{n-k}

kk 次成功可以出现在 nn 次实验中的任意位置,共有 (nk)\binom{n}{k} 种情况
所以总概率为重复独立地同一实验 nn 次,其中某事件 AA 每次发生的概率为 pp

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

检查全概率和

k=0nP(X=k)=k=0n(nk)pk(1p)nk=(p+1p)n=1\sum\limits_{k=0}^n P(X=k) = \sum\limits_{k=0}^n \binom{n}{k} p^k (1-p)^{n-k} = (p + 1 - p)^n = 1

期望值

E[X]=k=0nkP(X=k)=k=0nk(nk)pk(1p)nk=k=1nkn!k!(nk)!pk(1p)nk=k=1nn!(k1)!(nk)!pk(1p)nk=npk=1n(n1)!(k1)!(nk)!pk1(1p)(n1)(k1)=npj=0n1(n1j)pj(1p)(n1)j=np(p+1p)n1=np\begin{aligned} E[X] &= \sum\limits_{k=0}^n k P(X=k) \\ &= \sum\limits_{k=0}^n k \binom{n}{k} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=1}^n k \frac{n!}{k!(n-k)!} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=1}^n \frac{n!}{(k-1)!(n-k)!} p^k (1-p)^{n-k} \\ &= np \sum\limits_{k=1}^n \frac{(n-1)!}{(k-1)!(n-k)!} p^{k-1} (1-p)^{(n-1)-(k-1)} \\ &= np \sum\limits_{j=0}^{n-1} \binom{n-1}{j} p^j (1-p)^{(n-1)-j} \\ &= np (p + 1 - p)^{n-1} \\ &= np \end{aligned}

方差

V[X]=E[(XE[X])2]=E[X2](E[X])2=k=0nk2P(X=k)(np)2=k=0nk2(nk)pk(1p)nk(np)2=k=1nk2n!k!(nk)!pk(1p)nk(np)2=k=1nkn!(k1)!(nk)!pk(1p)nk(np)2=npk=1nk(n1)!(k1)!(nk)!pk1(1p)(n1)(k1)(np)2=npj=0n1(j+1)(n1j)pj(1p)(n1)j(np)2=np(j=0n1j(n1j)pj(1p)(n1)j+j=0n1(n1j)pj(1p)(n1)j)(np)2=np((n1)p+1)(np)2=np(1p)\begin{aligned} V[X] &= E[(X - E[X])^2] \\ &= E[X^2] - (E[X])^2 \\ &= \sum\limits_{k=0}^n k^2 P(X=k) - (np)^2 \\ &= \sum\limits_{k=0}^n k^2 \binom{n}{k} p^k (1-p)^{n-k} - (np)^2 \\ &= \sum\limits_{k=1}^n k^2 \frac{n!}{k!(n-k)!} p^k (1-p)^{n-k} - (np)^2 \\ &= \sum\limits_{k=1}^n k \frac{n!}{(k-1)!(n-k)!} p^k (1-p)^{n-k} - (np)^2 \\ &= np \sum\limits_{k=1}^n k \frac{(n-1)!}{(k-1)!(n-k)!} p^{k-1} (1-p)^{(n-1)-(k-1)} - (np)^2 \\ &= np \sum\limits_{j=0}^{n-1} (j+1) \binom{n-1}{j} p^j (1-p)^{(n-1)-j} - (np)^2 \\ &= np \left( \sum\limits_{j=0}^{n-1} j \binom{n-1}{j} p^j (1-p)^{(n-1)-j} + \sum\limits_{j=0}^{n-1} \binom{n-1}{j} p^j (1-p)^{(n-1)-j} \right) - (np)^2 \\ &= np \left( (n-1)p + 1 \right) - (np)^2 \\ &= np(1-p) \end{aligned}

矩母函数

MX(t)=E[etX]=k=0netkP(X=k)=k=0netk(nk)pk(1p)nk=k=0n(nk)(pet)k(1p)nk=(pet+1p)n\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=0}^n e^{tk} P(X=k) \\ &= \sum\limits_{k=0}^n e^{tk} \binom{n}{k} p^k (1-p)^{n-k} \\ &= \sum\limits_{k=0}^n \binom{n}{k} (pe^t)^k (1-p)^{n-k} \\ &= (pe^t + 1 - p)^n \end{aligned}

\square

示例
某个工厂生产的零件有 3%3\% 的次品率,现从中随机抽取 1010 个零件,求其中恰好有 22 个次品的概率

设随机变量 XX 表示抽取的 1010 个零件中次品的个数,则 XB(10,0.03)X \sim B(10, 0.03)

P(X=2)=(102)0.0320.9780.0746P(X=2) = \binom{10}{2} \cdot 0.03^2 \cdot 0.97^8 \approx 0.0746

\square

# Poisson 分布

在二项分布中,如果实验量 nn 很大,会使得实际计算变成复杂
所以在二项分布的基础上,如果令 n,p0n \to \infty, p \to 0np=λnp = \lambda 始终保持为常数
那么此时随机变量 XX 的分布称为 Poisson 分布 (Poisson Distribution)「ポアソン分布」,记为 XP(λ)X \sim P(\lambda)

P(X=k)=λkeλk!P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}

Poisson 分布主要应用在单位时间或单位面积这种基本上不能离散化的场景中

命题
Poisson 分布的

  • 期望值 E[X]=λE[X] = \lambda
  • 方差 V[X]=λV[X] = \lambda
  • 矩母函数 MX(t)=E[etX]=eλ(et1)M_X(t) = E[e^{tX}] = e^{\lambda(e^t - 1)} \quad
证明

概率良定性
由于 Poisson 分布是基于二项分布的,所以首先有

P(X=k)=(nk)pk(1p)nkP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}

此处代入 p=λnp = \frac{\lambda}{n} \quad

P(X=k)=(nk)(λn)k(1λn)nkP(X=k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k}

nn \to \infty

n!nk(nk)!=(11n)(12n)(1k1n)1\frac{n!}{n^k(n-k)!} = (1 - \frac{1}{n})(1 - \frac{2}{n}) \cdots (1 - \frac{k-1}{n}) \to 1

(1λn)neλ(1 - \frac{\lambda}{n})^n \to e^{-\lambda}

所以当 0k0 \leq k 被固定的时候

limn(nk)(λn)k(1λn)nk=λkeλk!\lim\limits_{n \to \infty} \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1-\frac{\lambda}{n}\right)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}

检查全概率和

k=0P(X=k)=k=0λkeλk!=eλk=0λkk!=eλeλ=1\sum\limits_{k=0}^\infty P(X=k) = \sum\limits_{k=0}^\infty \frac{\lambda^k e^{-\lambda}}{k!} = e^{-\lambda} \sum\limits_{k=0}^\infty \frac{\lambda^k}{k!} = e^{-\lambda} e^{\lambda} = 1

期望值

E[X]=k=0kP(X=k)=k=0kλkeλk!=k=1kλkeλk!=k=1λkeλ(k1)!=λeλk=1λk1(k1)!=λeλj=0λjj!=λeλeλ=λ\begin{aligned} E[X] &= \sum\limits_{k=0}^\infty k P(X=k) \\ &= \sum\limits_{k=0}^\infty k \frac{\lambda^k e^{-\lambda}}{k!} \\ &= \sum\limits_{k=1}^\infty k \frac{\lambda^k e^{-\lambda}}{k!} \\ &= \sum\limits_{k=1}^\infty \frac{\lambda^k e^{-\lambda}}{(k-1)!} \\ &= \lambda e^{-\lambda} \sum\limits_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} \\ &= \lambda e^{-\lambda} \sum\limits_{j=0}^\infty \frac{\lambda^j}{j!} \\ &= \lambda e^{-\lambda} e^{\lambda} \\ &= \lambda \end{aligned}

方差

V[X]=E[(XE[X])2]=E[X2](E[X])2=k=0k2P(X=k)λ2=k=0k2λkeλk!λ2=k=1k2λkeλk!λ2=k=1kλkeλ(k1)!λ2=λeλk=1kλk1(k1)!λ2=λeλj=0(j+1)λjj!λ2=λeλ(j=0jλjj!+j=0λjj!)λ2=λeλ(λeλ+eλ)λ2=λ(λ+1)λ2=λ\begin{aligned} V[X] &= E[(X - E[X])^2] \\ &= E[X^2] - (E[X])^2 \\ &= \sum\limits_{k=0}^\infty k^2 P(X=k) - \lambda^2 \\ &= \sum\limits_{k=0}^\infty k^2 \frac {\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum\limits_{k=1}^\infty k^2 \frac{\lambda^k e^{-\lambda}}{k!} - \lambda^2 \\ &= \sum\limits_{k=1}^\infty k \frac{\lambda^k e^{-\lambda}}{(k-1)!} - \lambda^2 \\ &= \lambda e^{-\lambda} \sum\limits_{k=1}^\infty k \frac{\lambda^{k-1}}{(k-1)!} - \lambda^2 \\ &= \lambda e^{-\lambda} \sum\limits_{j=0}^\infty (j+1) \frac{\lambda^j}{j!} - \lambda^2 \\ &= \lambda e^{-\lambda} \left( \sum\limits_{j=0}^\infty j \frac{\lambda^j}{j!} + \sum\limits_{j=0}^\infty \frac{\lambda^j}{j!} \right) - \lambda^2 \\ &= \lambda e^{-\lambda} (\lambda e^{\lambda} + e^{\lambda}) - \lambda^2 \\ &= \lambda (\lambda + 1) - \lambda^2 \\ &= \lambda \end{aligned}

矩母函数

MX(t)=E[etX]=k=0etkP(X=k)=k=0etkλkeλk!=eλk=0(λet)kk!=eλeλet=eλ(et1)\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=0}^\infty e^{tk} P(X=k) \\ &= \sum\limits_{k=0}^\infty e^{tk} \frac{\lambda^k e^{-\lambda}}{k!} \\ &= e^{-\lambda} \sum\limits_{k=0}^\infty \frac{(\lambda e^t)^k}{k!} \\ &= e^{-\lambda} e^{\lambda e^t} \\ &= e^{\lambda (e^t - 1)} \end{aligned}

\square

示例
已知某个路口每小时平均有 33 辆车经过,求在 11 小时内恰好有 55 辆车经过的概率

设随机变量 XX 表示在 11 小时内经过的车辆数,则 XP(3)X \sim P(3)

P(X=5)=35e35!0.1008P(X=5) = \frac{3^5 e^{-3}}{5!} \approx 0.1008

# 几何分布

重复独立地同一实验 nn 次,其中某事件 AA 每次发生的概率为 pp
记事件 AA 在第 kk 次实验中首次发生的概率为 P(X=k)P(X=k)
则此时随机变量 XX 的分布称为 几何分布 (Geometric Distribution)「幾何分布」,记为 XG(p)X \sim G(p)

P(X=k)=(1p)k1pP(X=k) = (1-p)^{k-1} p

命题
几何分布的

  • 期望值 E[X]=1pE[X] = \frac{1}{p} \quad
  • 方差 V[X]=1pp2V[X] = \frac{1-p}{p^2} \quad
  • 矩母函数 MX(t)=E[etX]=pet1(1p)et,t<ln(1p)M_X(t) = E[e^{tX}] = \frac{pe^t}{1 - (1-p)e^t},\quad t < -\ln(1-p)
证明

概率良定性
每次失败的概率为 1p1-p,在前 k1k-1 次实验中均失败,第 kk 次实验成功,所以直接用乘积得到概率

(1p)k1p(1-p)^{k-1} p

检查全概率和

k=1P(X=k)=k=1(1p)k1p=pk=0(1p)k=p11(1p)=1\sum\limits_{k=1}^\infty P(X=k) = \sum\limits_{k=1}^\infty (1-p)^{k-1} p = p \sum\limits_{k=0}^\infty (1-p)^k = p \cdot \frac{1}{1-(1-p)} = 1

期望值

E[X]=k=1kP(X=k)=k=1k(1p)k1p=pk=1k(1p)k1=p1(1(1p))2=1p\begin{aligned} E[X] &= \sum\limits_{k=1}^\infty k P(X=k) \\ &= \sum\limits_{k=1}^\infty k (1-p)^{k-1} p \\ &= p \sum\limits_{k=1}^\infty k (1-p)^{k-1} \\ &= p \cdot \frac{1}{(1-(1-p))^2} \\ &= \frac{1}{p} \end{aligned}

方差

V[X]=E[X2](E[X])2=pk=1k2(1p)k1(1p)2=p1+(1p)(1(1p))31p2=1pp2\begin{aligned} V[X] &= E[X^2] - (E[X])^2 \\ &= p \sum\limits_{k=1}^\infty k^2 (1-p)^{k-1} - \left(\frac{1}{p}\right)^2 \\ &= p \cdot \frac{1+(1-p)}{(1-(1-p))^3} - \frac{1}{p^2} \\ &= \frac{1-p}{p^2} \end{aligned}

矩母函数

MX(t)=E[etX]=k=1etkP(X=k)=k=1etk(1p)k1p=pet1(1p)et,t<ln(1p)\begin{aligned} M_X(t) &= E[e^{tX}] \\ &= \sum\limits_{k=1}^\infty e^{tk} P(X=k) \\ &= \sum\limits_{k=1}^\infty e^{tk} (1-p)^{k-1} p \\ &= p \cdot \frac{e^{t}}{1-(1-p)e^{t}},\quad t < -\ln(1-p) \end{aligned}

\square

示例
某抽卡游戏中,抽到 SSR 的概率为 0.6%0.6\%,求抽一百次后能出 SSR 的概率,以及平均需要抽多少次才能抽到 SSR (不考虑保底机制)

设随机变量 XX 表示抽到 SSR 所需的次数,则 XG(0.006)X \sim G(0.006)

P(X100)=k=1100(10.006)k1×0.006=1(10.006)1000.4512P(X \leq 100) = \sum\limits_{k=1}^{100} (1-0.006)^{k-1} \times 0.006 = 1 - (1-0.006)^{100} \approx 0.4512

所以抽一百次后能出 SSR 的概率约为 45.12%45.12\%

E[X]=10.006166.67E[X] = \frac{1}{0.006} \approx 166.67

平均需要抽 167167 次才能抽到 SSR

# 均匀分布

在区间 [a,b][a,b] 上,如果随机变量 XX 的概率处处相等
则称随机变量 XX 服从区间 [a,b][a,b] 上的 均匀分布 (Uniform Distribution)「均勻分布」,记为 XU(a,b)X \sim U(a,b)

f(x)={1ba,axb0,otherwisef(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{otherwise} \end{cases}

命题
均匀分布的

  • 期望值 E[X] = \frac{a+b}
  • 方差 V[X] = \frac{(b-a)^2}
  • 矩母函数 MX(t)=E[etX]=etbetat(ba),t0M_X(t) = E[e^{tX}] = \frac{e^{tb} - e^{ta}}{t(b-a)},\quad t \neq 0
证明

概率良定性
均匀分布的概率密度函数处处相等,所以如果设某一点的概率为 cc 的话,根据全概率和为 1

abcdx=c(ba)=1    c=1ba\int_a^b c \, dx = c(b-a) = 1 \implies c = \frac{1}{b-a}

所以概率密度函数为

f(x)={1ba,axb0,otherwisef(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{otherwise} \end{cases}

期望值

E[X]=+xf(x)dx=abx1badx=1bab2a22=a+b2\begin{aligned} E[X] &= \int_{-\infty}^{+\infty} x f(x) \, dx \\ &= \int_a^b x \cdot \frac{1}{b-a} \, dx \\ &= \frac{1}{b-a} \cdot \frac{b^2 - a^2}{2} \\ &= \frac{a+b}{2} \end{aligned}

方差

V[X]=E[X2](E[X])2=+x2f(x)dx(a+b2)2=abx21badx(a+b)24=1bab3a33(a+b)24=b2+ab+a23(a+b)24=b2+ab+a23a2+2ab+b24=4(b2+ab+a2)3(a2+2ab+b2)12=b22ab+a212=(ba)212\begin{aligned} V[X] &= E[X^2] - (E[X])^2 \\ &= \int_{-\infty}^{+\infty} x^2 f(x) \, dx - \left(\frac{a+b}{2}\right)^2 \\ &= \int_a^b x^2 \cdot \frac{1}{b-a} \, dx - \frac{(a+b)^2}{4} \\ &= \frac{1}{b-a} \cdot \frac{b^3 - a^3}{3} - \frac{(a+b)^2}{4} \\ &= \frac{b^2 + ab + a^2}{3} - \frac{(a+b)^2}{4} \\ &= \frac{b^2 + ab + a^2}{3} - \frac{a^2 + 2ab + b^2}{4} \\ &= \frac{4(b^2 + ab + a^2) - 3(a^2 + 2ab + b^2)}{12} \\ &= \frac{b^2 - 2ab + a^2}{12} = \frac{(b-a)^2}{12} \end{aligned}

矩母函数

MX(t)=E[etX]=+etxf(x)dx=abetx1badx=1baetbetat,t0=etbetat(ba)\begin{aligned} M_X(t) &= E[e^{tX}] = \int_{-\infty}^{+\infty} e^{tx} f(x) \, dx \\ &= \int_a^b e^{tx} \cdot \frac{1}{b-a} \, dx \\ &= \frac{1}{b-a} \cdot \frac{e^{tb} - e^{ta}}{t},\quad t \neq 0 \\ &= \frac{e^{tb} - e^{ta}}{t(b-a)} \end{aligned}

\square

示例
某个工厂生产的零件尺寸均匀分布在 [9.8cm,10.2cm][9.8cm, 10.2cm] 之间,求随机抽取一个零件时,其尺寸小于 10cm10cm 的概率,以及该零件尺寸的期望值和方差

设随机变量 XX 表示零件的尺寸,则 XU(9.8,10.2)X \sim U(9.8, 10.2)

P(X<10)=9.810110.29.8dx=109.80.4=0.5P(X < 10) = \int_{9.8}^{10} \frac{1}{10.2 - 9.8} \, dx = \frac{10 - 9.8}{0.4} = 0.5

E[X]=9.8+10.22=10cmE[X] = \frac{9.8 + 10.2}{2} = 10cm

V[X]=(10.29.8)212=0.16120.0133cm2V[X] = \frac{(10.2 - 9.8)^2}{12} = \frac{0.16}{12} \approx 0.0133 cm^2

# 指数分布

回想一下 Poisson 分布中,已经处理了针对单位时间内事件发生次数的问题
而如果换为考虑事件事件发生的间隔事件,那随机变量将成为连续型变量(时间)

假设以下前提

  • 事件 AA 在某时间段发生的概率是独立的
  • 在极小的时间间隔 Δt\Delta t 内,事件 AA 至多发生一次,并且其概率由 λΔt\lambda \Delta t 给出,其中 λ>0\lambda > 0 为常数

令随机变量 XX 表示事件 AA 发生的时间间隔
XX 服从参数为 λ\lambda指数分布 (Exponential Distribution)「指数分布」,记为 XExp(λ)X \sim \text{Exp}(\lambda)

f(x)={λeλx,x00,otherwisef(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & \text{otherwise} \end{cases}

命题
指数分布的

  • 期望值 E[X] = \frac{1}
  • 方差 V[X] = \frac{1}
  • 矩母函数 MX(t)=E[etX]=λλt,t<λM_X(t) = E[e^{tX}] = \frac{\lambda}{\lambda - t},\quad t < \lambda
证明

概率良定性
λ>0\lambda>0。在 x<0x < 0 时,事件 AA 不可能发生,所以概率密度函数为 00
x0x \geq 0 时,定义指数分布的尾分布为 P(X>x)=eλxP(X > x)=e^{-\lambda x}。因此

P(Xx)=1P(X>x)=1eλxP(X \leq x) = 1 - P(X > x) = 1 - e^{-\lambda x}

对其求导即得概率密度函数

f(x)={λeλx,x00,otherwisef(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & \text{otherwise} \end{cases}

检查全概率和

+f(x)dx=0+λeλxdx=1\int_{-\infty}^{+\infty} f(x) dx = \int_0^{+\infty} \lambda e^{-\lambda x} dx = 1

期望值

E[X]=+xf(x)dx=0+xλeλxdx=[xeλx]0++0+eλxdx=0+[1λeλx]0+=1λ\begin{aligned} E[X] &= \int_{-\infty}^{+\infty} x f(x) \, dx \\ &= \int_0^{+\infty} x \cdot \lambda e^{-\lambda x} \, dx \\ &= \left[-x e^{-\lambda x}\right]_0^{+\infty} + \int_0^{+\infty} e^{-\lambda x} \, dx \\ &= 0 + \left[-\frac{1}{\lambda} e^{-\lambda x}\right]_0^{+\infty} \\ &= \frac{1}{\lambda} \end{aligned}

方差

V[X]=E[X2](E[X])2=+x2f(x)dx(1λ)2=0+x2λeλxdx1λ2=[x2eλx]0++0+2xeλxdx1λ2=0+2[xλeλx]0++0+2λeλxdx1λ2=0+0+[2λ2eλx]0+1λ2=2λ21λ2=1λ2\begin{aligned} V[X] &= E[X^2] - (E[X])^2 \\ &= \int_{-\infty}^{+\infty} x^2 f(x) \, dx - \left(\frac{1}{\lambda}\right)^2 \\ &= \int_0^{+\infty} x^2 \cdot \lambda e^{-\lambda x} \, dx - \frac{1}{\lambda^2} \\ &= \left[-x^2 e^{-\lambda x}\right]_0^{+\infty} + \int_0^{+\infty} 2x e^{-\lambda x} \, dx - \frac{1}{\lambda^2} \\ &= 0 + 2\left[-\frac{x}{\lambda} e^{-\lambda x}\right]_0^{+\infty} + \int_0^{+\infty} \frac{2}{\lambda} e^{-\lambda x} \, dx - \frac{1}{\lambda^2} \\ &= 0 + 0 + \left[-\frac{2}{\lambda^2} e^{-\lambda x}\right]_0^{+\infty} - \frac{1}{\lambda^2} \\ &= \frac{2}{\lambda^2} - \frac{1}{\lambda^2} = \frac{1}{\lambda^2} \end{aligned}

矩母函数

MX(t)=E[etX]=+etxf(x)dx=0+etxλeλxdx=λ0+e(λt)xdx=λ[1λte(λt)x]0+,t<λ=λλt\begin{aligned} M_X(t) &= E[e^{tX}] = \int_{-\infty}^{+\infty} e^{tx} f(x) \, dx \\ &= \int_0^{+\infty} e^{tx} \cdot \lambda e^{-\lambda x} \, dx \\ &= \lambda \int_0^{+\infty} e^{-(\lambda - t)x} \, dx \\ &= \lambda \left[-\frac{1}{\lambda - t} e^{-(\lambda - t)x}\right]_0^{+\infty},\quad t < \lambda \\ &= \frac{\lambda}{\lambda - t} \end{aligned}

\square

示例
已知某个路口每小时平均有 33 辆车经过,求在 11 小时内恰好有 55 辆车经过的概率

设随机变量 XX 表示 11 小时内经过的车辆数,则 XP(3)X \sim P(3)

P(X=5)=35e35!0.1008P(X=5) = \frac{3^5 e^{-3}}{5!} \approx 0.1008

# 正态分布

正态分布是最重要的连续型概率分布,没有之一

f(x)=12πσe(xμ)22σ2,xRf(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad x \in \mathbb R

其中 μR\mu \in \mathbb Rσ>0\sigma > 0 为常数
给出的概率分布称为 正态分布 (Normal Distribution)「正規分布」,记为 XN(μ,σ2)X \sim N(\mu, \sigma^2)

::info no-icon
命题
正态分布的

  • 期望值 E[X]=μE[X] = \mu
  • 方差 V[X]=σ2V[X] = \sigma^2
  • 矩母函数 MX(t)=E[etX]=eμt+12σ2t2M_X(t) = E[e^{tX}] = e^{\mu t + \frac{1}{2} \sigma^2 t^2}
证明

概率良定性
首先证明概率密度函数的积分为 11

+f(x)dx=+12πσe(xμ)22σ2dx=12πσ+e(xμ)22σ2dx=12πσσ2π=1\begin{aligned} \int_{-\infty}^{+\infty} f(x) \, dx &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{+\infty} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \frac{1}{\sqrt{2\pi}\sigma} \cdot \sigma \sqrt{2\pi} \\ &= 1 \end{aligned}

期望值

E[X]=+xf(x)dx=+x12πσe(xμ)22σ2dx=μ+12πσe(xμ)22σ2dx++(xμ)12πσe(xμ)22σ2dx=μ1+0=μ\begin{aligned} E[X] &= \int_{-\infty}^{+\infty} x f(x) \, dx \\ &= \int_{-\infty}^{+\infty} x \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \mu \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx + \int_{-\infty}^{+\infty} (x - \mu) \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \mu \cdot 1 + 0 \\ &= \mu \end{aligned}

方差

V[X]=E[(XE[X])2]=E[(Xμ)2]=+(xμ)2f(x)dx=+(xμ)212πσe(xμ)22σ2dx=σ2\begin{aligned} V[X] &= E[(X - E[X])^2] \\ &= E[(X - \mu)^2] \\ &= \int_{-\infty}^{+\infty} (x - \mu)^2 f(x) \, dx \\ &= \int_{-\infty}^{+\infty} (x - \mu)^2 \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \sigma^2 \end{aligned}

矩母函数

MX(t)=E[etX]=+etxf(x)dx=+etx12πσe(xμ)22σ2dx=12πσ+e12σ2(x22(μ+σ2t)x+μ2)dx=12πσeμt+12σ2t2+e12σ2(x(μ+σ2t))2dx=eμt+12σ2t2\begin{aligned} M_X(t) &= E[e^{tX}] = \int_{-\infty}^{+\infty} e^{tx} f(x) \, dx \\ &= \int_{-\infty}^{+\infty} e^{tx} \cdot \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} \, dx \\ &= \frac{1}{\sqrt{2\pi}\sigma} \int_{-\infty}^{+\infty} e^{-\frac{1}{2\sigma^2} \left( x^2 - 2(\mu + \sigma^2 t)x + \mu^2 \right)} \, dx \\ &= \frac{1}{\sqrt{2\pi}\sigma} e^{\mu t + \frac{1}{2} \sigma^2 t^2} \int_{-\infty}^{+\infty} e^{-\frac{1}{2\sigma^2} (x - (\mu + \sigma^2 t))^2} \, dx \\ &= e^{\mu t + \frac{1}{2} \sigma^2 t^2} \end{aligned}

\square

:::

示例
某个工厂生产的零件尺寸服从均值为 10cm10cm,标准差为 0.1cm0.1cm 的正态分布,求随机抽取一个零件时,其尺寸在 9.8cm9.8cm10.2cm10.2cm 之间的概率

设随机变量 XX 表示零件的尺寸,则 XN(10,0.01)X \sim N(10, 0.01)
标准化后有

Z=Xμσ=X100.1Z = \frac{X - \mu}{\sigma} = \frac{X - 10}{0.1}

因此

P(9.8<X<10.2)=P(9.8100.1<Z<10.2100.1)=P(2<Z<2)P(9.8 < X < 10.2) = P\left(\frac{9.8 - 10}{0.1} < Z < \frac{10.2 - 10}{0.1}\right) = P(-2 < Z < 2)

查标准正态分布表可得

P(2<Z<2)0.9544P(-2 < Z < 2) \approx 0.9544

因此

P(9.8<X<10.2)0.9544P(9.8 < X < 10.2) \approx 0.9544