碎碎念:再写CSDN之前有一小段时间写数模公众号的经历,但是公众号看的人实在太少了,而且排版和公式、代码编辑都没有CSDN这么方便,所以坚持一算时间就没有更新了。公众号大多写的是概念性的基础,稍加修改搬到咱们的主战场吧。
第一次更新:2027/5/10
目录
一. 引入
二. 概率论基础
1. 随机试验
2. 样本点
3. 样本空间
4. 事件
5. 事件域/集类
6. 可测空间
7. 概率
8. 概率空间
三. 数理统计基础
1. 随机变量
2. 分布函数
3. 概率密度函数
4. n阶矩
5. 特征函数
四. 后记
一. 引入
啃数模论文或者教材学习过程中是不是总会看到:
特征函数,分布函数,随机变量,随机试验...
绕口令???
让原本艰难的学习道路雪上加霜
不慌不慌
小编为大家整理了常见概率论概念及其相关关系
先扫清学习路上的最大障碍—基础概念理解问题
首先我们举个通俗易懂的栗子,结合相关概率论定义便于理解一点:
白雪公主的后妈准备毒害白雪公主,于是她准备了一筐毒苹果,所有苹果形状大小一样,只有颜色不同,有红绿两种颜色的苹果。于是她想哄骗白雪公主随机抽一个苹果尝一下。
切入正题,我们来聊一下概率论里的基础概念,以及这个栗子中所蕴含的概率论知识:
二. 概率论基础
1. 随机试验
随机试验E : 一个试验,如果它的结果预先无法确定,但满足如下三个性质,即称之为随机试验:(1)相同条件下可重复进行;(2)所有试验可能结果已知;(3)每次试验结果具有不确定性。
让我们更好地理解一下这个概念,随机试验本质上就是一个“活动”,结合栗子理解一下这个活动:白雪公主每次抽取苹果的动作就是一个随机试验,首先在篮子里可重复多次进行抽取活动,满足了随机试验的可重复性;其次,篮子里的苹果只有红绿两种颜色,白雪公主抽取的结果无非是红苹果或是绿苹果,满足了所有可能结果的已知条件;最后,白雪公主闭眼抽苹果,每次抽出什么颜色的苹果是不确定的,满足了试验结果的不确定性。
是不是感觉懂了一点呀,那我们继续进一步理解:
2. 样本点
样本点ω:一个随机试验所产生的结果。
样本点本质上就是一个“试验结果”,也就是说在我们的栗子里,它就代表白雪公主进行了一次抽取活动后抽出来个啥颜色的苹果。比如白雪公主第一次抽出来一个红苹果,那第一次随机试验对应的样本点就是“红苹果”这个结果。
3. 样本空间
样本空间Ω:所有试验的可能结果组成的集合。
样本空间可以理解为“白雪公主提的篮子”,也就是由所有样本点组成的集合,这个集合里装满了所有的试验结果,即{红苹果,绿苹果,红苹果....}。但理解的时候要注意可不能用集合的互异性来衡量样本空间,样本空间相当于白雪公主手里也提了一个篮子,她每次抽一个苹果就放在自己的篮子里,她抽取了n次就会得到n个样本点,那放进自己的篮子里(即样本空间)中也会有n个元素。
4. 事件
事件 A:由样本空间的某些样本点构成的子集合。
事件可以理解为“将某一类随机试验结果”,在样本空间包含的n个样本点中,我们可以将一类样本点看作一类事件,把这些样本点放在一个集合中命名为一个事件A。比如,在样本空间中,“红苹果”这个元素出现了m次,就可以命名事件A为“抽到红苹果”,其中事件A={ω红苹果1,ω红苹果2,ω红苹果3...}。
5. 事件域/集类
集类 /事件域𝓐 :由样本空间中的若干子集构成的集合。
到这儿是不是有些许抽象了?不急我们分解它的定义来看:
我们刚刚解释了事件可以理解为“一类结果”,那集类作为一些子集的集合也可以理解为是“一类事件”;比如抽到红苹果是一个事件,抽到绿苹果也是一个事件,那我们可以定义抽到红苹果或者绿苹果这一类“抽到苹果事件”为一个集类。
为了便于进一步的计算我们定义一种特殊的集类—σ域(也称σ代数,一般用𝓕来表示这一集类),𝓕 满足:(1)Ω∈ 𝓕;(2)对逆运算封闭;(3)对可列并封闭。
6. 可测空间
可测空间(Ω,𝓕 ):定义二元体(Ω,𝓕 )为可测空间。
7. 概率
概率P:定义在在事件域𝓕 上,值域在[0,1]之间的,且满足条件(1)0≤P≤1;(2)P(Ω)=1;(3)满足可列可加性 的实值函数P(·)。
概率本质上就是一个函数,既然是函数,我们在遇到这个概念的时候就一定要明确它的定义域是谁?值域是谁?函数关系怎么确定?(函数关系我们后面讲,这里先要理解:概率本质上就是一个函数,是一个事件映射到[0,1]区间的函数)。在栗子里的理解就是白雪公主抽到红苹果这个事件发生的可能性有多大?
8. 概率空间
概率空间(Ω,𝓕 ,P):定义三元体(Ω,𝓕 ,P)为概率空间。
三. 数理统计基础
我们在理解全局概念后接着来看一看建立在样本空间上的基础概念:
1. 随机变量
随机变量:X(ω)是定义在样本空间Ω上的单值实函数,若对于任意实数x∈R,有{x:X(ω)≤x}∈𝓕,则称X(ω)是𝓕上的随机变量。
随机变量本质上还是一个函数,我们需要明确这个函数的定义域为样本空间Ω(即所有样本点构成的集合),值域需要根据具体题目去确定。随机变量将随机随机事件数字化,使得每一个样本点都有一个实值对应,同时样本空间里的每个事件都有一个数确定。那为什么要引入这个随机变量呢?因为样本点(即我们看到的现象)是很难描述的,所以通过将样本点定量化,使得我们一看样本点的取值就知道实际对应情况且方便我们进一步进行统计分析。在我们的栗子里我们可以规定白雪公主每次可以取三个苹果,随机变量的取值对应取到的红苹果的数目。比如取到{红苹果,绿苹果,绿苹果}则有随机变量X=1;若取得{绿苹果,红苹果,红苹果}则随机变量X=2。
在概率论中根据随机变量取值范围(取值形式)将其分为两类:
- 离散型随机变量顾名思义是指随机变量取值是离散的,即此时的样本空间为可数集或者有限集。接着上面的栗子,白雪公主取苹果,列举所有的情况我们发现随机变量的取值只可能为{0,1,2,3},故我们栗子里的随机变量就是一个离散型随机变量;
- 连续性随机变量:如果变量可以在某个区间内取任一实数(即随机变量X的所有可能取值不可以逐个列举出来),即变量的取值可以是连续的。比如在做实验中白雪公主的后妈把苹果放在雪地里,拿出来以后在一段时间内测量苹果的温度,此时温度的取值是连续的,即温度为一连续型随机变量。
2. 分布函数
分布函数:函数F(x)=P{ω:X(ω)≤x},x∈R称为随机变量X的分布函数。
分布函数是定义在R上,值域为[0,1]的实值函数。它表示随机变量X取值小于等于变量x的概率,这里一定要区分清楚两个x,大X表示随机变量,小x表示普通变量,且分布函数是定义在x∈R上的函数。其次我们需要再思考,为什么要引入分布函数?在得到一系列样本点情况即随机变量值后,我们想研究这些随机变量值的特点,于是可以考虑从概率角度描述随机变量取值特点。已知X的分布函数,就可以知道X落在任一区间上的概率,在这个意义上说,分布函数完整地描述了随机变量的统计规律性。
3. 概率密度函数
概率密度函数(pdf):连续型随机变量X的分布函数F(x),若存在一非负函数f(x),对∀x∈R,满足:,则称f(x)为随机变量X的概率密度函数。
概率密度函数是定义在R上,值域为[0,+∞]的实值函数。概率密度函数的引入仍然是以概率角度来描述随机变量值,我们想知道随机变量某一取值的概率为多少(可以理解为想知道对应某一事件出现了多少次),可以通过将所有随机变量取值都列出,根据古典概型等概率论知识求得对应概率,即得到了离散型随机变量的分布律P{X=xk}(k=1,2,3...}。对于连续型随机变量我们无法列出所有随机变量值,因此引入了连续性随机变量f(x)来描述随机变量取值概率。
4. n阶矩
n阶矩E(Xn):在数学和统计学中,矩是对变量分布和形态特点的一组度量。n阶矩被定义为一变量的n次方与其概率密度函数之积的积分。通常一阶矩又被称为数学期望,二阶矩被称为方差,三阶矩被称为偏度,四阶矩被称为峰度。
5. 特征函数
特征函数φX(t):随机变量X的特征函数定义为 。
四. 后记
特征函数可以看作分布函数的另一种描述方式。将特征函数做泰勒展开可得到特征函数中包含了分布函数的所有矩,即分布函数的所有特征都可以由特征函数反应出。[1]
白雪公主与后妈的栗子结束啦
欢迎大家和小编共同讨论学习
小编觉得在学习概念性问题时可以从三方面探索理解即:
What?Why?How?
概念是什么?怎么定义的?
为什么要提出这个概念?这个概念用来干什么?
最后这个概念用在哪儿?
本文的概念部分来源于百度百科
部分来源于《随机过程基础》
特征函数解释来源于 https://www.zhihu.com/tardis/bd/ans/376439033?source_id=1001
end