本节介绍数个常见的概率分布
- 离散型
- 离散均匀分布
- 二项分布
- Poisson 分布(二项分布的极限形式)
- 几何分布(二项分布的累积分布形式)
- 连续型
- 均匀分布
- 指数分布(几何分布的连续型对应)
- 正态分布
- Gamma 分布
# 离散均匀分布
在一个有限集合 Ω 上,若各个取值的概率均相等,则称该随机变量服从 离散均匀分布 (Discrete Uniform Distribution)「離散一様分布」,即
#Ω=n⟹P(X=xi)=n1,i=1,2,…,n
命题
离散均匀分布中
- 期望值 E[X] = \dfrac{n + 1}
- 方差 V[X] = \dfrac{n^2 - 1}
- 矩母函数 M_X(t) = E[e^{tX}] = \dfrac{e^t (1 - e^{nt})}
证明
概率良定性
这是显然的,因为每个取值的概率均为 n1,所以概率和为 1
期望值
E[X]=i=1∑nxiP(X=xi)=i=1∑nxin1=n1i=1∑nxi=n1⋅2n(n+1)=2n+1
方差
V[X]=E[(X−E[X])2]=E[X2]−(E[X])2=i=1∑nxi2P(X=xi)−(2n+1)2=i=1∑nxi2n1−4(n+1)2=n1⋅6n(n+1)(2n+1)−4(n+1)2=6(n+1)(2n+1)−4(n+1)2=12(n+1)(4n+2−3n−3)=12(n+1)(n−1)=12n2−1
矩母函数
MX(t)=E[etX]=i=1∑netxiP(X=xi)=i=1∑netxi⋅n1=n1i=1∑netxi=n1et⋅1−et1−ent=n(1−et)et(1−ent)
□
# 二项分布
记事件 A 在 n 次实验中发生 k 次的概率为 P(X=k)
则此时随机变量 X 的分布称为 二项分布 (Binomial Distribution)「二項分布」,记为 X∼B(n,p)
P(X=k)=(kn)pk(1−p)n−k
其中 (kn)=k!(n−k)!n! 为组合数
命题
二项分布中
- 期望值 E[X]=np
- 方差 V[X]=np(1−p)
- 矩母函数 MX(t)=E[etX]=(pet+1−p)n
证明
概率良定性
每次成功的概率为 p,失败的概率为 1−p
在 n 次实验中恰好有 k 次成功的概率为
k 个成功乘以 n−k 个失败
pk(1−p)n−k
而 k 次成功可以出现在 n 次实验中的任意位置,共有 (kn) 种情况
所以总概率为重复独立地同一实验 n 次,其中某事件 A 每次发生的概率为 p
P(X=k)=(kn)pk(1−p)n−k
检查全概率和
k=0∑nP(X=k)=k=0∑n(kn)pk(1−p)n−k=(p+1−p)n=1
期望值
E[X]=k=0∑nkP(X=k)=k=0∑nk(kn)pk(1−p)n−k=k=1∑nkk!(n−k)!n!pk(1−p)n−k=k=1∑n(k−1)!(n−k)!n!pk(1−p)n−k=npk=1∑n(k−1)!(n−k)!(n−1)!pk−1(1−p)(n−1)−(k−1)=npj=0∑n−1(jn−1)pj(1−p)(n−1)−j=np(p+1−p)n−1=np
方差
V[X]=E[(X−E[X])2]=E[X2]−(E[X])2=k=0∑nk2P(X=k)−(np)2=k=0∑nk2(kn)pk(1−p)n−k−(np)2=k=1∑nk2k!(n−k)!n!pk(1−p)n−k−(np)2=k=1∑nk(k−1)!(n−k)!n!pk(1−p)n−k−(np)2=npk=1∑nk(k−1)!(n−k)!(n−1)!pk−1(1−p)(n−1)−(k−1)−(np)2=npj=0∑n−1(j+1)(jn−1)pj(1−p)(n−1)−j−(np)2=np(j=0∑n−1j(jn−1)pj(1−p)(n−1)−j+j=0∑n−1(jn−1)pj(1−p)(n−1)−j)−(np)2=np((n−1)p+1)−(np)2=np(1−p)
矩母函数
MX(t)=E[etX]=k=0∑netkP(X=k)=k=0∑netk(kn)pk(1−p)n−k=k=0∑n(kn)(pet)k(1−p)n−k=(pet+1−p)n
□
示例
某个工厂生产的零件有 3% 的次品率,现从中随机抽取 10 个零件,求其中恰好有 2 个次品的概率
解
设随机变量 X 表示抽取的 10 个零件中次品的个数,则 X∼B(10,0.03)
P(X=2)=(210)⋅0.032⋅0.978≈0.0746
□
# Poisson 分布
在许多情况下,随机变量服从的分布是一个无法被离散化的过程,例如在单位时间内某事件发生的次数
这一类分布本质上可以看作是 n→∞ 且 p→0 下的二项分布。为了确保趋于极限时不会使得分布变得无意义,需要保持存在一个常数 λ=np,始终成立
注意到基本极限的结论
n→∞lim(1+na)n=ea
那么,可以通过取二项分布下的极限
P(X=k)=(kn)(nλ)k(1−nλ)n−k=k!(n−k)!n!⋅nkλk⋅(1−nλ)n⋅(1−nλ)−k=k!λk(1−nλ)n⋅nkn(n−1)(n−2)⋯(n−k+1)→k!λke−λ(n→∞)
那么此时随机变量 X 的分布称为 Poisson 分布 (Poisson Distribution)「ポアソン分布」,记为 X∼P(λ)
P(X=k)=k!λke−λ
Poisson 分布主要应用在单位时间或单位面积这种基本上不能离散化的场景中
命题
Poisson 分布的
- 期望值 E[X]=λ
- 方差 V[X]=λ
- 矩母函数 MX(t)=E[etX]=eλ(et−1)
证明
概率良定性
由于 Poisson 分布是基于二项分布的,所以首先有
P(X=k)=(kn)pk(1−p)n−k
此处代入 p=nλ
P(X=k)=(kn)(nλ)k(1−nλ)n−k
当 n→∞ 时
nk(n−k)!n!=(1−n1)(1−n2)⋯(1−nk−1)→1
(1−nλ)n→e−λ
所以当 0≤k 被固定的时候
n→∞lim(kn)(nλ)k(1−nλ)n−k=k!λke−λ
检查全概率和
k=0∑∞P(X=k)=k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λeλ=1
期望值
E[X]=k=0∑∞kP(X=k)=k=0∑∞kk!λke−λ=k=1∑∞kk!λke−λ=k=1∑∞(k−1)!λke−λ=λe−λk=1∑∞(k−1)!λk−1=λe−λj=0∑∞j!λj=λe−λeλ=λ
方差
V[X]=E[(X−E[X])2]=E[X2]−(E[X])2=k=0∑∞k2P(X=k)−λ2=k=0∑∞k2k!λke−λ−λ2=k=1∑∞k2k!λke−λ−λ2=k=1∑∞k(k−1)!λke−λ−λ2=λe−λk=1∑∞k(k−1)!λk−1−λ2=λe−λj=0∑∞(j+1)j!λj−λ2=λe−λ(j=0∑∞jj!λj+j=0∑∞j!λj)−λ2=λe−λ(λeλ+eλ)−λ2=λ(λ+1)−λ2=λ
矩母函数
MX(t)=E[etX]=k=0∑∞etkP(X=k)=k=0∑∞etkk!λke−λ=e−λk=0∑∞k!(λet)k=e−λeλet=eλ(et−1)
□
示例
已知某个路口每小时平均有 3 辆车经过,求在 1 小时内恰好有 5 辆车经过的概率
解
设随机变量 X 表示在 1 小时内经过的车辆数,则 X∼P(3)
P(X=5)=5!35e−3≈0.1008
# 几何分布
重复独立地同一实验 n 次,其中某事件 A 每次发生的概率为 p
记事件 A 在第 k 次实验中首次发生的概率为 P(X=k)
则此时随机变量 X 的分布称为 几何分布 (Geometric Distribution)「幾何分布」,记为 X∼G(p)
P(X=k)=(1−p)k−1p
命题
几何分布的
- 期望值 E[X]=p1
- 方差 V[X]=p21−p
- 矩母函数 MX(t)=E[etX]=1−(1−p)etpet,t<−ln(1−p)
证明
概率良定性
每次失败的概率为 1−p,在前 k−1 次实验中均失败,第 k 次实验成功,所以直接用乘积得到概率
(1−p)k−1p
检查全概率和
k=1∑∞P(X=k)=k=1∑∞(1−p)k−1p=pk=0∑∞(1−p)k=p⋅1−(1−p)1=1
期望值
E[X]=k=1∑∞kP(X=k)=k=1∑∞k(1−p)k−1p=pk=1∑∞k(1−p)k−1=p⋅(1−(1−p))21=p1
方差
V[X]=E[X2]−(E[X])2=pk=1∑∞k2(1−p)k−1−(p1)2=p⋅(1−(1−p))31+(1−p)−p21=p21−p
矩母函数
MX(t)=E[etX]=k=1∑∞etkP(X=k)=k=1∑∞etk(1−p)k−1p=p⋅1−(1−p)etet,t<−ln(1−p)
□
几何分布具有一个重要的性质:发生过的事件不会影响未来的概率
- 这将粉碎一类赌徒心理:“我已经输了这么多次了,下一次一定会赢”
定理 几何分布的无记忆性
令随机变量 X∼G(p),则对于 m,n∈N,都有
P(X>m+n∣X>m)=P(X>n)
证明
P(X>m+n∣X>m)=P(X>m)P(X>m+n∩X>m)=P(X>m)P(X>m+n)=k=m+1∑∞(1−p)k−1pk=m+n+1∑∞(1−p)k−1p=(1−p)mk=1∑∞(1−p)k−1p(1−p)m+nk=1∑∞(1−p)k−1p=(1−p)n=P(X>n)
□
示例
某抽卡游戏中,抽到 SSR 的概率为 0.6%,求抽一百次后能出 SSR 的概率,以及平均需要抽多少次才能抽到 SSR (不考虑保底机制)
解
设随机变量 X 表示抽到 SSR 所需的次数,则 X∼G(0.006)
P(X≤100)=k=1∑100(1−0.006)k−1×0.006=1−(1−0.006)100≈0.4512
所以抽一百次后能出 SSR 的概率约为 45.12%
E[X]=0.0061≈166.67
平均需要抽 167 次才能抽到 SSR
# 均匀分布
在区间 [a,b] 上,如果随机变量 X 的概率处处相等
则称随机变量 X 服从区间 [a,b] 上的 均匀分布 (Uniform Distribution)「均勻分布」,记为 X∼U(a,b)
f(x)={b−a1,0,a≤x≤botherwise
命题
均匀分布的
- 期望值 E[X] = \frac{a+b}
- 方差 V[X] = \frac{(b-a)^2}
- 矩母函数 MX(t)=E[etX]=t(b−a)etb−eta,t=0
证明
概率良定性
均匀分布的概率密度函数处处相等,所以如果设某一点的概率为 c 的话,根据全概率和为 1
∫abcdx=c(b−a)=1⟹c=b−a1
所以概率密度函数为
f(x)={b−a1,0,a≤x≤botherwise
期望值
E[X]=∫−∞+∞xf(x)dx=∫abx⋅b−a1dx=b−a1⋅2b2−a2=2a+b
方差
V[X]=E[X2]−(E[X])2=∫−∞+∞x2f(x)dx−(2a+b)2=∫abx2⋅b−a1dx−4(a+b)2=b−a1⋅3b3−a3−4(a+b)2=3b2+ab+a2−4(a+b)2=3b2+ab+a2−4a2+2ab+b2=124(b2+ab+a2)−3(a2+2ab+b2)=12b2−2ab+a2=12(b−a)2
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫abetx⋅b−a1dx=b−a1⋅tetb−eta,t=0=t(b−a)etb−eta
□
示例
某个工厂生产的零件尺寸均匀分布在 [9.8cm,10.2cm] 之间,求随机抽取一个零件时,其尺寸小于 10cm 的概率,以及该零件尺寸的期望值和方差
解
设随机变量 X 表示零件的尺寸,则 X∼U(9.8,10.2)
P(X<10)=∫9.81010.2−9.81dx=0.410−9.8=0.5
E[X]=29.8+10.2=10cm
V[X]=12(10.2−9.8)2=120.16≈0.0133cm2
# 指数分布
回想一下 Poisson 分布中,已经处理了针对单位时间内事件发生次数的问题
而如果换为考虑事件事件发生的间隔事件,那随机变量将成为连续型变量(时间)
假设以下前提
- 事件 A 在某时间段发生的概率是独立的
- 在极小的时间间隔 Δt 内,事件 A 至多发生一次,并且其概率由 λΔt 给出,其中 λ>0 为常数
令随机变量 X 表示事件 A 发生的时间间隔
则 X 服从参数为 λ 的 指数分布 (Exponential Distribution)「指数分布」,记为 X∼Exp(λ)
f(x)={λe−λx,0,x≥0otherwise
命题
指数分布的
- 期望值 E[X] = \frac{1}
- 方差 V[X] = \frac{1}
- 矩母函数 MX(t)=E[etX]=λ−tλ,t<λ
证明
概率良定性
设 λ>0。在 x<0 时,事件 A 不可能发生,所以概率密度函数为 0。
在 x≥0 时,定义指数分布的尾分布为 P(X>x)=e−λx。因此
P(X≤x)=1−P(X>x)=1−e−λx
对其求导即得概率密度函数
f(x)={λe−λx,0,x≥0otherwise
检查全概率和
∫−∞+∞f(x)dx=∫0+∞λe−λxdx=1
期望值
E[X]=∫−∞+∞xf(x)dx=∫0+∞x⋅λe−λxdx=[−xe−λx]0+∞+∫0+∞e−λxdx=0+[−λ1e−λx]0+∞=λ1
方差
V[X]=E[X2]−(E[X])2=∫−∞+∞x2f(x)dx−(λ1)2=∫0+∞x2⋅λe−λxdx−λ21=[−x2e−λx]0+∞+∫0+∞2xe−λxdx−λ21=0+2[−λxe−λx]0+∞+∫0+∞λ2e−λxdx−λ21=0+0+[−λ22e−λx]0+∞−λ21=λ22−λ21=λ21
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫0+∞etx⋅λe−λxdx=λ∫0+∞e−(λ−t)xdx=λ[−λ−t1e−(λ−t)x]0+∞,t<λ=λ−tλ
□
示例
某电子元件的寿命服从参数为 λ=0.001(单位:小时−1)的指数分布。
- 求该元件寿命超过 1000 小时的概率。
- 已知该元件已经使用了 500 小时,求它能再使用 1000 小时的概率。
解
设随机变量 X 表示元件寿命(小时),则 X∼Exp(0.001)。
CDF 为 F(x)=1−e−0.001x。
- P(X>1000)=1−P(X≤1000)=e−0.001×1000=e−1≈0.3679。
- 由无记忆性:
P(X>1500∣X>500)=P(X>1000)=e−1≈0.3679。
或者直接计算:P(X>500)P(X>1500)=e−0.5e−1.5=e−1。
# 正态分布
正态分布是最重要的连续型概率分布,没有之一
由
f(x)=2πσ1e−2σ2(x−μ)2,x∈R
其中 μ∈R,σ>0 为常数
给出的概率分布称为 正态分布 (Normal Distribution)「正規分布」,记为 X∼N(μ,σ2)
特别地,称 N(0,1) 为 标准正态分布 (Standard Normal Distribution)「標準正規分布」
::info no-icon
命题
正态分布的
- 期望值 E[X]=μ
- 方差 V[X]=σ2
- 矩母函数 MX(t)=E[etX]=eμt+21σ2t2
证明
概率良定性
首先证明概率密度函数的积分为 1
∫−∞+∞f(x)dx=∫−∞+∞2πσ1e−2σ2(x−μ)2dx=2πσ1∫−∞+∞e−2σ2(x−μ)2dx=2πσ1⋅σ2π=1
期望值
E[X]=∫−∞+∞xf(x)dx=∫−∞+∞x⋅2πσ1e−2σ2(x−μ)2dx=μ∫−∞+∞2πσ1e−2σ2(x−μ)2dx+∫−∞+∞(x−μ)⋅2πσ1e−2σ2(x−μ)2dx=μ⋅1+0=μ
方差
V[X]=E[(X−E[X])2]=E[(X−μ)2]=∫−∞+∞(x−μ)2f(x)dx=∫−∞+∞(x−μ)2⋅2πσ1e−2σ2(x−μ)2dx=σ2
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫−∞+∞etx⋅2πσ1e−2σ2(x−μ)2dx=2πσ1∫−∞+∞e−2σ21(x2−2(μ+σ2t)x+μ2)dx=2πσ1eμt+21σ2t2∫−∞+∞e−2σ21(x−(μ+σ2t))2dx=eμt+21σ2t2
□
:::
示例
某个工厂生产的零件尺寸服从均值为 10cm,标准差为 0.1cm 的正态分布,求随机抽取一个零件时,其尺寸在 9.8cm 到 10.2cm 之间的概率
解
设随机变量 X 表示零件的尺寸,则 X∼N(10,0.01)
标准化后有
Z=σX−μ=0.1X−10
因此
P(9.8<X<10.2)=P(0.19.8−10<Z<0.110.2−10)=P(−2<Z<2)
查标准正态分布表可得
P(−2<Z<2)≈0.9544
因此
P(9.8<X<10.2)≈0.9544
令 Z∼N(0,1),定义 误差函数 (Error Function)「誤差関数」 为
erf(x)=π2∫0xe−t2dt
通过误差函数,可以将标准正态分布的累积分布函数表示为
Φ(x)=P(Z≤x)=21(1+erf(2x))
也可以得到超过 x 的概率
P(∣Z∣≥x)=1−P(−x≤Z≤x)=1−(Φ(x)−Φ(−x))=1−erf(2x)
# Gamma 分布
若随机变量 Z 的概率密度函数为
f(z)=⎩⎪⎨⎪⎧Γ(k)θk1zk−1e−θz,0,z≥0otherwise
则称 Z 服从参数为 k 和 θ 的 Gamma 分布 (Gamma Distribution)「ガンマ分布」,记为 Z∼Γ(k,θ)
命题
若 Y1,Y2,…,Yn 独立且均服从指数分布 Exp(λ)(即 Γ(1,1/λ)),则它们的和服从 Gamma 分布:
k=1∑nYk∼Γ(n,1/λ)
(注:此处 θ=1/λ)