概率基础——均匀分布
介绍
均匀分布是最简单的概率分布之一,它描述了一个随机变量在一定范围内的取值概率均等的情况。在均匀分布中,每一个数值区间的概率密度都相同,因此它也被称为等概率分布。
理论及公式
在区间 [ a , b ] [a, b] [a,b]上的均匀分布的概率密度函数(PDF)为:
f ( x ) = 1 b − a f(x) = \frac{1}{b - a} f(x)=b−a1
其中, a a a 和 b b b 分别是区间的起始值和结束值。
均匀分布的参数
- 起始值 a a a:区间的起始值,也是分布的最小值。
- 结束值 b b b:区间的结束值,也是分布的最大值。
举例
假设一家餐厅的送餐时间服从均匀分布,送餐时间的取值范围为30分钟到60分钟之间。我们希望了解送餐时间的分布情况,以便更好地安排送餐员的工作。
概率密度曲线
接下来,我们将使用Python来绘制不同参数的均匀分布的概率密度曲线。
from scipy.stats import uniform
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(-1, 3.5, 1000)
uniform_rv_0 = uniform()
uniform_rv_1 = uniform(loc=0.5, scale=2)
plt.plot(x, uniform_rv_0.pdf(x), label='[0,1]', color='red', lw=2, alpha=0.6)
plt.plot(x, uniform_rv_1.pdf(x), label='[0.5,2.5]', color='blue', lw=2, alpha=0.6, linestyle='--')
plt.legend(loc='best', frameon=False)
plt.grid(ls="--")
plt.show()
以上代码将绘制出2条不同参数的均匀分布概率密度曲线。从图中可以看出,不同参数的均匀分布曲线在指定的区间内具有相同的概率密度,且在该区间外概率密度为零。构造均匀分布的时候,传入两个参数
l
o
c
loc
loc和
s
c
a
l
e
scale
scale,指的是随机变量
X
X
X在区间
[
l
o
c
,
l
o
c
+
s
c
a
l
e
]
[loc, loc+scale]
[loc,loc+scale]上均匀分布,而区间内概率密度函数的取值,满足处处相等。
from scipy.stats import uniform
import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(-1, 3.5, 1000)
uniform_rv = uniform(1, 2)
uniform_rvs = uniform_rv.rvs(1000000)
plt.plot(x, uniform_rv.pdf(x), 'r-', lw=2, label='uniform pdf')
plt.hist(uniform_rvs, bins=30, density=True, alpha=0.6, label='uniform samples')
plt.legend(loc='best', frameon=False)
plt.grid(ls="--")
plt.show()
总结
本文介绍了均匀分布及Python实现,利用了函数包的各个方法计算出各个理论统计值,均匀分布虽然简单,但是在概率论里面非常重要。