概率 随机变量以及分布

一、基础定义及分类

1、随机变量

        随机变量是一个从样本空间(所有可能结果的集合)到实数集的函数。(随机变量的值可以是离散的,也可以是连续的。 )

        事件可以定义为随机变量取特定值的集合。

2、离散型随机变量

        随机变量的取值是可数的,即有限个或可数无限个。取值之间有“间隔”,不是连续变化的。每个取值都有一个特定的概率,且所有取值的概率之和等于1。

        概率质量函数(PMF):对于所有的 x,有 P(X=x)≥0;所有可能取值的概率之和等于1。

 例如:假设由5个黑球,3个白球,每次取一个球不放回,直到取到黑球为止,X为取到白球的数量,求取到黑球的概率。

解:列出渠道黑球可能(0白1黑、1白1黑、2白1黑、3白1黑),将白球数量列为X,则

P(X=0)= 5/8;P(X=1)= 3/8 * 5/7 =15/56;P(X=2)= 3/8 *2/7* 5/6=5/56;P(X=3)= 3/8 *2/7* 1/6* 5/5 =1/56

画出概率分布表:

X0123
P5/815/565/561/56

验证:5/8 +  15/56 + 5/56+ 1/56 =1

3、连续型随机变量

        取值可以是某个区间内任意实数的随机变量。随机变量的取值是连续的,可以在一个或多个区间内取任意值。 取值是不可数的,即有无限多个可能的取值。每个取值区间都有一个特定的概率,且整个取值范围的概率密度函数积分等于1。在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。

        概率密度函数(PDF) ;对于一维实随机变量X,如果存在非负可积函数f(x),使得对于任意实数x,a\leq b 存在 P(a<X\leq b)=\int _a^bf(x) dx;对于所有的 x,有f(x)\geq 0 ;整个取值范围的积分等于1,即\int _{-\infty}^{+\infty} f(x) dx=1 。概率密度函数的积分其实就是求曲线在某个区间内的面积。

例如:假设密度函数 ,求k

解:根据函数列出 \int _{-\infty}^{+\infty}f(x)dx=\int _{0}^{2}f(x)dx = \int _{0}^{2} kx+1dx = (\dfrac{k}{2} * x^2+x)|_0^2 =2k+2=1 => k =-1/2

二、分布函数

1、定义

        描述随机变量取值分布情况的函数,无论是离散型随机变量还是连续型随机变量,都可以通过分布函数来描述其概率特性。分布函数通常指的是累积分布函数(Cumulative Distribution Function, CDF),用 F(x) 表示。

2、使用方法

        积分布函数(CDF) ;对于随机变量 X,其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率: F(x)=P(X≤x) 。

        随着 x 的增加,F(x) 是非减的,即 F(x1)≤F(x2)对于所有的 x1≤x2 成立。 F(x)的值域在 0 到 1 之间,即 0≤F(x)≤1。任意点 x 都是右连续的。对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。

        常用公式: F(x) = P(X≤x) ;  P(X≤a) = F(a) ; P(X>a) = 1-P(X≤a) = 1-F(a); P(a<X≤b) = P(X≤b)-P(X≤a)=F(b)-F(a)

例如离散型:假设概率分布表如下(求分布函数F(x) ):

X-123
P1/21/31/6

   根据x取值划分({-\infty},-1)、(-1,2),(2,3),(3,{\infty}

则:F(x)=P(X≤-1)=0 ;F(x)=P(-1≤X<2)=1/2;F(x)=P(2≤X<3)=5/6 ; F(x)=P(3≤X<{\infty})=1

例如连续型:假设函数如图,求分布函数F(x):

根据x取值划分({-\infty},0)、(0,2)、(2,{\infty}

F(X)= \int _{0}^{2}f(x)dx =\int _{0}^{2} -1/2 * x +1 dx =  -1/4 * x^{2} + x

3、常见分布

3.1离散型

3.1.1、0-1分布

        伯努利分布 :C_n^k p^k {(1-p)}^{n-k}

3.1.2 几何分布

        在独立重复的伯努利试验中,首次成功所需的试验次数:  P(X=k)={(1-p)}^{k-1} ⋅ p

3.1.3、二项分布

        n 次伯努利试验中成功的次数,那么 X 服从参数为 n 和 p 的二项分布,记作 X∼B(n,p) :P(X=k)=C_n^kp^k{(1-p)}^{n-k} 

3.1.4、泊松分布

        固定时间或空间内事件发生次数的离散型概率分布。 适用于事件发生的概率较小且事件之间相互独立的情况。 P(X=k)=λ^k  /  k!    * e^-λ

3.1.5、均匀分布

        续均匀分布中,所有可能的结果是连续的,并且在相同长度间隔的分布概率是相同的。

        均匀分布的概率密度函数(PDF):对于连续型随机变量 X,如果它服从区间 [a,b]上的均匀分布,其概率密度函数为:f(x)= 1 / (b-a) ,其实就是面积为1,宽为 b-a 的长方形区域,那它的高就是1 / (b-a)

3.2、连续型

3.2.1、指数分布

        概率密度函数  x 是随机变量,表示事件发生的时间间隔;λ 是率参数,表示单位时间内事件发生的平均次数。其对应的分布函数如图:

3.2.2、正态分布

        表达形式: X \sim N(μ,σ^2)

        概率密度函数 (x 是随机变量;μ 是均值;σ是标准差;σ^2是方差),其基本性质为 y=f(x)以x=u为对称轴;x=u时,f(x)取到最大值 ;y=f(x)以x轴为渐近线,x±σ为拐点 ;σ固定,μ 变化,图像左右移动;μ 固定,σ变小,最高点上移,σ变大,最高点下移。

        分布函数 

3.2.3、标准正态分布

         表达形式: X \sim N(0,1) ;标准正态分布的均值为0,标准差为1(y轴是对称轴,为偶函数)

        概率密度函数 ,也就是在正态分布基础上将 μ 与 σ 进行赋值后变形。

        分布函数  

3.2.4、正态分布标准化

第一步:设 y=x-μ 

第二步:标准化,设 z = y /σ = (x-μ )/σ

得到了以Z为变量的正态分布函数  Z∼N(0,1) 。

标准化正态分布和正态分布的关系  

概率密度函数   

分布函数 

三、随机变量函数的分布

        从原有随机变量出发,通过某种函数关系得到新的随机变量。

1、离散型

第一步:确定x的值 ,找出所有使得 g(x)=y 成立的 x 的值。

第二步:对于每个满足条件的 x,将 X 取该值后的函数结果进行整理,相同结果的概率相加。

        离散型随机变量函数的分布函数计算,最简单的方法是列出随机变量X的分布表,然后根据新的函数关系计算出新随机变量Y的值,其值对应的概率就是X原来值对应的概率值,然后形成分布表,如果Y值有重复,则将重复值对应的概率相加即可。

例如1:假设随机变量X的分布表:求Y=X^2

X123
P0.20.50.3

解:根据x的变化列出y的变化

Y149
P0.20.50.3

例如2:假设随机变量X的分布表:求 Y=X^4 - 1

解:先根据随机变量的函数关系计算Y值,再将X的概率值填入

Y150-1015
P0.20.10.50.10.1

进行重复项合并,按照从低到高排列:

Y150-1
P0.30.20.5

2、连续型

第一步:获取 Y的分布函数 ;F_Y(y) =P(Y≤y) = P(g(X)≤y)

第二步:对分布函数求导获得概率密度函数:f_Y(y)=d/dy * F_Y(y)

例如:已知随机变量X的概率密度函数为 f_X(x),求 Y=3X+2 的密度函数,假设f_X(x)服从在区间[0,4]的均匀分布 ,求f_Y(x)

解:

第一步:求Y的分布函数:F_Y(x) =P(Y≤x) = P(g(X)≤x) = P(3X+2 ≤ x )=P(X≤(x-2)/3) =F_X((x-2)/3)

第二步:对分布函数求导:f_Y(x)=F_Y'(x) = F_x' ((x-2)/3) = 1/3 * f_X((x-2)/3)

第三步:带入x的概率密度函数内容,得到 区间从[0,4] =>[0,12] ,1/4=>1/12,其他不变

例如: 求Y=2X+8的概率密度

第一步:F_Y(x) =F_Y(Y ≤ x) = F_X(2X+8≤x)=F_X((x-8)/(2))

第二步:f_Y'(x)=F_Y'(X)=F_X'((x-8)/(2))=1/2 * f_X'((x-8)/(2))

第三步:带入x的密度函数,获得y的密度函数:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/893745.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity开发Hololens项目

Unity打包Hololens设备 目录Visual Studio2019 / Visual Studio2022 远端部署设置Visual Studio2019 / Visual Studio2022 USB部署设置Hololens设备如何查找自身IPHololens设备门户Unity工程内的打包设置 目录 记录下自己做MR相关&#xff1a;Unity和HoloLens设备的历程。 Vi…

软件企业选择第三方软件检测机构有哪些好处?

在软件开发的当今时代&#xff0c;确保软件的质量和性能是每个企业面临的挑战&#xff0c;因此软件检测公正必不可少。随着市场的需求&#xff0c;越来越多企业会选择将该项工作交由第三方软件检测机构进行。第三方软件检测机构指独立于软件开发方和需求方的第三方机构&#xf…

5、JavaScript(二)

17.对象 1、对象&#xff1a;⽤来存储多个数据的 是由多个键值对/key value对组成的 ⽤来描述⼀个事物的 相当于多个变量的集合 2、格式 &#xff1a;{key:value,key:value} 键/值对 属性名&#xff1a;属性值 3、对象的属性值是不限制数据类型的&#xff0c;甚至还可以是对…

CEEMDAN +组合预测模型(BiLSTM-Attention + ARIMA)

往期精彩内容&#xff1a; 时序预测&#xff1a;LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较 全是干货 | 数据集、学习资料、建模资源分享&#xff01; EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现&#xff08;一&#xff09;EMD-CSDN博客 EMD、EEM…

JavaWeb合集05-SpringBoot基础知识

五、SpringBoot基础知识 0、实用方法 0.1 动态获取某个文件路径 //getResource( name:" emp.txt") 更具名称获取资源链接&#xff1b;getFile() 获取文件对象 String filePaththis.getClass().getClassLoader().getResource( name:" emp.txt").getFile(…

数仓建设:如何设计数据治理考评规则?

目录 0 为什么要数据治理&#xff1f; 2 什么是数据治理&#xff1f; ​​​​​​​3 如何数据治理如何落地&#xff1f; ​​​​​​​4 数据考评的指标 5 考核指标列表 6 数仓团队应如何建设&#xff1f; 6.1 ​​​​​​​考评指标分析 6.2 ​​​健康分计算规则…

[Linux#67][IP] 报头详解 | 网络划分 | CIDR无类别 | DHCP动态分配 | NAT转发 | 路由器

目录 一. IP协议头格式 学习任何协议前的两个关键问题 IP 报头与有效载荷分离 分离方法 为什么需要16位总长度 如何交付 二. 网络通信 1.IP地址的划分理念 2. 子网管理 3.网络划分 CIDR&#xff08;无类别域间路由&#xff09; 目的IP & 当前路由器的子网掩码 …

ubuntu服务器监控程序崩溃自动重启

环境&#xff1a;监控程序运行情况分为两种情况&#xff0c;一种带界面&#xff0c;一种控制台程序&#xff0c;带界面程序采用脚本监控方式&#xff0c;不带界面采用Supervisor工具监控。 1. 自动重启带界面程序&#xff1a; #!/bin/sh while true; do processExistps aux | …

一些简单的编程题(Java与C语言)

引言&#xff1a; 这篇文章呢&#xff0c;小编将会举一些简单的编程题用来帮助大家理解一下Java代码&#xff0c;并且与C语言做个对比&#xff0c;不过这篇文章所出现的题目小编不会向随缘解题系列里面那样详细的讲解每一到题&#xff0c;本篇文章的主要目的是帮助小编和读者们…

【YOLOv11改进[CONV]】使用SAconv模块魔改YOLOv11 + 含全部代码和详细修改方式

本文将进行在YOLOv11中使用SAconv魔改v11,文中含全部代码、详细修改方式。助您轻松理解改进的方法。 改进前和改进后的参数对比如下: 目录 一 SAconv 二 使用SAconv魔改v11

构建 effet.js 人脸识别交互系统的实战之路

构建 effet.js 人脸识别交互系统的实战之路 文章目录 构建 effet.js 人脸识别交互系统的实战之路前言一、什么是effet.js二、为什么需要使用effet.js四、effet.js能做什么五、使用步骤1.引入库2.main.js中注册全局2.使用3.效果图 六、其他模式讲解人脸打卡人脸添加睡眠检测 在h…

[产品管理-46]:产品组合管理中的项目平衡与管道平衡的区别

目录 一、项目平衡 1.1 概述 1.2 项目的类型 1、根据创新程度和开发方式分类 2、根据产品开发和市场周期分类 3、根据风险程度分类 4、根据市场特征分类 5、根据产品生命周期分类 1.3 产品类型的其他分类 1、按物理形态分类 2、按功能或用途分类 3、按技术或创新程…

OpenCV高级图形用户界面(12)用于更改指定窗口的大小函数resizeWindow()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 cv::resizeWindow() 函数用于更改指定窗口的大小。这使得你可以根据需要调整窗口的宽度和高度。 注释 指定的窗口大小是指图像区域的大小。工具栏…

必学的20个Excel表格操作python脚本!

示例数据 (bank_data.xlsx) 首先&#xff0c;我们创建一个示例的Excel文件bank_data.xlsx&#xff0c;并填充一些示例数据。 import pandas as pd # 创建示例数据 data { 客户ID: [1, 2, 3, 4, 5], 姓名: [张三, 李四, 王五, 赵六, 孙七], 联系方式: [13800000000, 13900000…

get请求(豆瓣电影第一页爬取)

目录 &#xff08;一&#xff09;需要的python库 import urllib.request import urllib.parse &#xff08;二&#xff09;找到url和headers url headers &#xff08;三&#xff09;创建一个请求对象和返回一个响应对象 创建一个请求对象 返回一个响应对象 &#xff08…

【网络篇】计算机网络——网络层详述(笔记)

目录 一、网络层 1. 网络传输流程简述 2. 转发和路由选择 3. 控制平面&#xff1a;SDN 方法 二、路由器工作原理 1. 概述 &#xff08;1&#xff09;输入端口 &#xff08;2&#xff09;交换结构 &#xff08;3&#xff09;输出端口 &#xff08;4&#xff09;路由选…

特步引入IPD管理,钉钉项目 Teambition 助力高效产品研发管理

中国是全球第二大消费市场&#xff0c;运动鞋服行业拥有着巨大的发展潜力。在过去五年时间里&#xff0c;随着中国产品品牌和质量的提升&#xff0c;体育市场的占有率格局发生了显著变化&#xff0c;不同于部分国际品牌巨头营收持续减弱&#xff0c;国产领军体育运动品牌「特步…

(C/C++)文件

目录 1. 为什么使用文件 2. 什么是文件 2.1 程序文件 2.2 数据文件 3. 文件的打开和关闭 3.1 文件指针 3.2 文件的打开和关闭 4. 文件的顺序读写 fputc fgetc fputs fgets fprintf fscanf fwrite fread sprintf和sscanf snprintf ​编辑 4对比一组函数(prin…

Linux驱动编程 - RTC子系统

目录 简介&#xff1a; 一、代码分析 1、RTC子系统初始化 2、注册RTC设备驱动 2.1 rtc_dev_prepare(rtc) 3、总结 二、ds1302 驱动分析 三、rtc设置和测试工具 1、date读/写系统时间 2、hwclock读/写RTC 简介&#xff1a; Linux中RTC设备驱动是一个标准的字符设备驱动&…

ZBrush和3D-Coat各自的优缺点是什么?

zbrush支持的模型面数高英文界面&#xff0c;3d coat支持的模型面数比zbrsh低有中文界 ZBrush优缺点 1、ZBrush优点&#xff1a; zbrush是高精度建模poser制作的首选。可搭配雕刻版使用&#xff0c;主要为烘焙高细节的铁图建模。因为是高精度模型&#xff0c;不适用于动画和游…