本节介绍数个常见的概率分布
# 二项分布
记事件 A 在 n 次实验中发生 k 次的概率为 P(X=k)
则此时随机变量 X 的分布称为 二项分布 (Binomial Distribution)「二項分布」,记为 X∼B(n,p)
P(X=k)=(kn)pk(1−p)n−k
其中 (kn)=k!(n−k)!n! 为组合数
命题
二项分布中
- 期望值 E[X]=np
- 方差 V[X]=np(1−p)
- 矩母函数 MX(t)=E[etX]=(pet+1−p)n
证明
概率良定性
每次成功的概率为 p,失败的概率为 1−p
在 n 次实验中恰好有 k 次成功的概率为
k 个成功乘以 n−k 个失败
pk(1−p)n−k
而 k 次成功可以出现在 n 次实验中的任意位置,共有 (kn) 种情况
所以总概率为重复独立地同一实验 n 次,其中某事件 A 每次发生的概率为 p
P(X=k)=(kn)pk(1−p)n−k
检查全概率和
k=0∑nP(X=k)=k=0∑n(kn)pk(1−p)n−k=(p+1−p)n=1
期望值
E[X]=k=0∑nkP(X=k)=k=0∑nk(kn)pk(1−p)n−k=k=1∑nkk!(n−k)!n!pk(1−p)n−k=k=1∑n(k−1)!(n−k)!n!pk(1−p)n−k=npk=1∑n(k−1)!(n−k)!(n−1)!pk−1(1−p)(n−1)−(k−1)=npj=0∑n−1(jn−1)pj(1−p)(n−1)−j=np(p+1−p)n−1=np
方差
V[X]=E[(X−E[X])2]=E[X2]−(E[X])2=k=0∑nk2P(X=k)−(np)2=k=0∑nk2(kn)pk(1−p)n−k−(np)2=k=1∑nk2k!(n−k)!n!pk(1−p)n−k−(np)2=k=1∑nk(k−1)!(n−k)!n!pk(1−p)n−k−(np)2=npk=1∑nk(k−1)!(n−k)!(n−1)!pk−1(1−p)(n−1)−(k−1)−(np)2=npj=0∑n−1(j+1)(jn−1)pj(1−p)(n−1)−j−(np)2=np(j=0∑n−1j(jn−1)pj(1−p)(n−1)−j+j=0∑n−1(jn−1)pj(1−p)(n−1)−j)−(np)2=np((n−1)p+1)−(np)2=np(1−p)
矩母函数
MX(t)=E[etX]=k=0∑netkP(X=k)=k=0∑netk(kn)pk(1−p)n−k=k=0∑n(kn)(pet)k(1−p)n−k=(pet+1−p)n
□
示例
某个工厂生产的零件有 3% 的次品率,现从中随机抽取 10 个零件,求其中恰好有 2 个次品的概率
解
设随机变量 X 表示抽取的 10 个零件中次品的个数,则 X∼B(10,0.03)
P(X=2)=(210)⋅0.032⋅0.978≈0.0746
□
# Poisson 分布
在二项分布中,如果实验量 n 很大,会使得实际计算变成复杂
所以在二项分布的基础上,如果令 n→∞,p→0 且 np=λ 始终保持为常数
那么此时随机变量 X 的分布称为 Poisson 分布 (Poisson Distribution)「ポアソン分布」,记为 X∼P(λ)
P(X=k)=k!λke−λ
Poisson 分布主要应用在单位时间或单位面积这种基本上不能离散化的场景中
命题
Poisson 分布的
- 期望值 E[X]=λ
- 方差 V[X]=λ
- 矩母函数 MX(t)=E[etX]=eλ(et−1)
证明
概率良定性
由于 Poisson 分布是基于二项分布的,所以首先有
P(X=k)=(kn)pk(1−p)n−k
此处代入 p=nλ
P(X=k)=(kn)(nλ)k(1−nλ)n−k
当 n→∞ 时
nk(n−k)!n!=(1−n1)(1−n2)⋯(1−nk−1)→1
(1−nλ)n→e−λ
所以当 0≤k 被固定的时候
n→∞lim(kn)(nλ)k(1−nλ)n−k=k!λke−λ
检查全概率和
k=0∑∞P(X=k)=k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λeλ=1
期望值
E[X]=k=0∑∞kP(X=k)=k=0∑∞kk!λke−λ=k=1∑∞kk!λke−λ=k=1∑∞(k−1)!λke−λ=λe−λk=1∑∞(k−1)!λk−1=λe−λj=0∑∞j!λj=λe−λeλ=λ
方差
V[X]=E[(X−E[X])2]=E[X2]−(E[X])2=k=0∑∞k2P(X=k)−λ2=k=0∑∞k2k!λke−λ−λ2=k=1∑∞k2k!λke−λ−λ2=k=1∑∞k(k−1)!λke−λ−λ2=λe−λk=1∑∞k(k−1)!λk−1−λ2=λe−λj=0∑∞(j+1)j!λj−λ2=λe−λ(j=0∑∞jj!λj+j=0∑∞j!λj)−λ2=λe−λ(λeλ+eλ)−λ2=λ(λ+1)−λ2=λ
矩母函数
MX(t)=E[etX]=k=0∑∞etkP(X=k)=k=0∑∞etkk!λke−λ=e−λk=0∑∞k!(λet)k=e−λeλet=eλ(et−1)
□
示例
已知某个路口每小时平均有 3 辆车经过,求在 1 小时内恰好有 5 辆车经过的概率
解
设随机变量 X 表示在 1 小时内经过的车辆数,则 X∼P(3)
P(X=5)=5!35e−3≈0.1008
# 几何分布
重复独立地同一实验 n 次,其中某事件 A 每次发生的概率为 p
记事件 A 在第 k 次实验中首次发生的概率为 P(X=k)
则此时随机变量 X 的分布称为 几何分布 (Geometric Distribution)「幾何分布」,记为 X∼G(p)
P(X=k)=(1−p)k−1p
命题
几何分布的
- 期望值 E[X]=p1
- 方差 V[X]=p21−p
- 矩母函数 MX(t)=E[etX]=1−(1−p)etpet,t<−ln(1−p)
证明
概率良定性
每次失败的概率为 1−p,在前 k−1 次实验中均失败,第 k 次实验成功,所以直接用乘积得到概率
(1−p)k−1p
检查全概率和
k=1∑∞P(X=k)=k=1∑∞(1−p)k−1p=pk=0∑∞(1−p)k=p⋅1−(1−p)1=1
期望值
E[X]=k=1∑∞kP(X=k)=k=1∑∞k(1−p)k−1p=pk=1∑∞k(1−p)k−1=p⋅(1−(1−p))21=p1
方差
V[X]=E[X2]−(E[X])2=pk=1∑∞k2(1−p)k−1−(p1)2=p⋅(1−(1−p))31+(1−p)−p21=p21−p
矩母函数
MX(t)=E[etX]=k=1∑∞etkP(X=k)=k=1∑∞etk(1−p)k−1p=p⋅1−(1−p)etet,t<−ln(1−p)
□
示例
某抽卡游戏中,抽到 SSR 的概率为 0.6%,求抽一百次后能出 SSR 的概率,以及平均需要抽多少次才能抽到 SSR (不考虑保底机制)
解
设随机变量 X 表示抽到 SSR 所需的次数,则 X∼G(0.006)
P(X≤100)=k=1∑100(1−0.006)k−1×0.006=1−(1−0.006)100≈0.4512
所以抽一百次后能出 SSR 的概率约为 45.12%
E[X]=0.0061≈166.67
平均需要抽 167 次才能抽到 SSR
# 均匀分布
在区间 [a,b] 上,如果随机变量 X 的概率处处相等
则称随机变量 X 服从区间 [a,b] 上的 均匀分布 (Uniform Distribution)「均勻分布」,记为 X∼U(a,b)
f(x)={b−a1,0,a≤x≤botherwise
命题
均匀分布的
- 期望值 E[X] = \frac{a+b}
- 方差 V[X] = \frac{(b-a)^2}
- 矩母函数 MX(t)=E[etX]=t(b−a)etb−eta,t=0
证明
概率良定性
均匀分布的概率密度函数处处相等,所以如果设某一点的概率为 c 的话,根据全概率和为 1
∫abcdx=c(b−a)=1⟹c=b−a1
所以概率密度函数为
f(x)={b−a1,0,a≤x≤botherwise
期望值
E[X]=∫−∞+∞xf(x)dx=∫abx⋅b−a1dx=b−a1⋅2b2−a2=2a+b
方差
V[X]=E[X2]−(E[X])2=∫−∞+∞x2f(x)dx−(2a+b)2=∫abx2⋅b−a1dx−4(a+b)2=b−a1⋅3b3−a3−4(a+b)2=3b2+ab+a2−4(a+b)2=3b2+ab+a2−4a2+2ab+b2=124(b2+ab+a2)−3(a2+2ab+b2)=12b2−2ab+a2=12(b−a)2
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫abetx⋅b−a1dx=b−a1⋅tetb−eta,t=0=t(b−a)etb−eta
□
示例
某个工厂生产的零件尺寸均匀分布在 [9.8cm,10.2cm] 之间,求随机抽取一个零件时,其尺寸小于 10cm 的概率,以及该零件尺寸的期望值和方差
解
设随机变量 X 表示零件的尺寸,则 X∼U(9.8,10.2)
P(X<10)=∫9.81010.2−9.81dx=0.410−9.8=0.5
E[X]=29.8+10.2=10cm
V[X]=12(10.2−9.8)2=120.16≈0.0133cm2
# 指数分布
回想一下 Poisson 分布中,已经处理了针对单位时间内事件发生次数的问题
而如果换为考虑事件事件发生的间隔事件,那随机变量将成为连续型变量(时间)
假设以下前提
- 事件 A 在某时间段发生的概率是独立的
- 在极小的时间间隔 Δt 内,事件 A 至多发生一次,并且其概率由 λΔt 给出,其中 λ>0 为常数
令随机变量 X 表示事件 A 发生的时间间隔
则 X 服从参数为 λ 的 指数分布 (Exponential Distribution)「指数分布」,记为 X∼Exp(λ)
f(x)={λe−λx,0,x≥0otherwise
命题
指数分布的
- 期望值 E[X] = \frac{1}
- 方差 V[X] = \frac{1}
- 矩母函数 MX(t)=E[etX]=λ−tλ,t<λ
证明
概率良定性
设 λ>0。在 x<0 时,事件 A 不可能发生,所以概率密度函数为 0。
在 x≥0 时,定义指数分布的尾分布为 P(X>x)=e−λx。因此
P(X≤x)=1−P(X>x)=1−e−λx
对其求导即得概率密度函数
f(x)={λe−λx,0,x≥0otherwise
检查全概率和
∫−∞+∞f(x)dx=∫0+∞λe−λxdx=1
期望值
E[X]=∫−∞+∞xf(x)dx=∫0+∞x⋅λe−λxdx=[−xe−λx]0+∞+∫0+∞e−λxdx=0+[−λ1e−λx]0+∞=λ1
方差
V[X]=E[X2]−(E[X])2=∫−∞+∞x2f(x)dx−(λ1)2=∫0+∞x2⋅λe−λxdx−λ21=[−x2e−λx]0+∞+∫0+∞2xe−λxdx−λ21=0+2[−λxe−λx]0+∞+∫0+∞λ2e−λxdx−λ21=0+0+[−λ22e−λx]0+∞−λ21=λ22−λ21=λ21
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫0+∞etx⋅λe−λxdx=λ∫0+∞e−(λ−t)xdx=λ[−λ−t1e−(λ−t)x]0+∞,t<λ=λ−tλ
□
示例
已知某个路口每小时平均有 3 辆车经过,求在 1 小时内恰好有 5 辆车经过的概率
解
设随机变量 X 表示 1 小时内经过的车辆数,则 X∼P(3)
P(X=5)=5!35e−3≈0.1008
# 正态分布
正态分布是最重要的连续型概率分布,没有之一
由
f(x)=2πσ1e−2σ2(x−μ)2,x∈R
其中 μ∈R,σ>0 为常数
给出的概率分布称为 正态分布 (Normal Distribution)「正規分布」,记为 X∼N(μ,σ2)
::info no-icon
命题
正态分布的
- 期望值 E[X]=μ
- 方差 V[X]=σ2
- 矩母函数 MX(t)=E[etX]=eμt+21σ2t2
证明
概率良定性
首先证明概率密度函数的积分为 1
∫−∞+∞f(x)dx=∫−∞+∞2πσ1e−2σ2(x−μ)2dx=2πσ1∫−∞+∞e−2σ2(x−μ)2dx=2πσ1⋅σ2π=1
期望值
E[X]=∫−∞+∞xf(x)dx=∫−∞+∞x⋅2πσ1e−2σ2(x−μ)2dx=μ∫−∞+∞2πσ1e−2σ2(x−μ)2dx+∫−∞+∞(x−μ)⋅2πσ1e−2σ2(x−μ)2dx=μ⋅1+0=μ
方差
V[X]=E[(X−E[X])2]=E[(X−μ)2]=∫−∞+∞(x−μ)2f(x)dx=∫−∞+∞(x−μ)2⋅2πσ1e−2σ2(x−μ)2dx=σ2
矩母函数
MX(t)=E[etX]=∫−∞+∞etxf(x)dx=∫−∞+∞etx⋅2πσ1e−2σ2(x−μ)2dx=2πσ1∫−∞+∞e−2σ21(x2−2(μ+σ2t)x+μ2)dx=2πσ1eμt+21σ2t2∫−∞+∞e−2σ21(x−(μ+σ2t))2dx=eμt+21σ2t2
□
:::
示例
某个工厂生产的零件尺寸服从均值为 10cm,标准差为 0.1cm 的正态分布,求随机抽取一个零件时,其尺寸在 9.8cm 到 10.2cm 之间的概率
解
设随机变量 X 表示零件的尺寸,则 X∼N(10,0.01)
标准化后有
Z=σX−μ=0.1X−10
因此
P(9.8<X<10.2)=P(0.19.8−10<Z<0.110.2−10)=P(−2<Z<2)
查标准正态分布表可得
P(−2<Z<2)≈0.9544
因此
P(9.8<X<10.2)≈0.9544