多维随机变量及其分布
1. 二维随机变量及其联合分布
在实际问题中,单单研究一个随机变量往往是不够的。比如在研究某种疾病时,医生可能需要同时观测患者的体温 和血压 。这就引出了多维随机变量的概念。
定义 二维随机变量(Two-dimensional Random Variable) 设 是一个随机试验,它的样本空间是 。设 和 是定义在 上的两个随机变量。由它们构成的向量 称为二维随机变量或二维随机向量。
定义 联合分布函数(Joint Distribution Function / Joint CDF) 设 是二维随机变量,对于任意实数 ,称
为二维随机变量 的联合分布函数。
从几何上看,如果将 看作平面上的点,那么 就是随机点 落在以 为右上顶点的无穷矩形区域中的概率。
1.1 联合分布函数的性质
联合分布函数 具有以下基本性质:
- 单调性: 分别关于 和 是单调不减的。即当 时,;当 时,。
- 有界性:对于任意的 ,。且有:
- 右连续性: 分别关于 和 都是右连续的。
- 非负性:对于任意实数 ,,随机点 落在矩形区域 的概率为:
1.2 联合分布函数的计算例题
例 1:设二维随机变量 的联合分布函数为:
其中 。求随机点 落在矩形区域 内的概率。
解答
利用性质 4:
代入分布函数定义: 因此,。
2. 二维离散型随机变量
如果二维随机变量 所有可能的取值是有限对或可列无穷多对 ,则称 为二维离散型随机变量。
定义 联合概率分布(Joint Probability Distribution / Joint PMF) 设二维离散型随机变量 所有可能的取值为 (),称
为 的联合概率分布(或联合分布律)。
联合分布律通常可以用表格形式列出,称为联合分布表:
联合分布律具有两个性质:
2.1 离散型例题
例 1:同时掷两枚均匀的骰子,记 为两枚骰子点数之和, 为两枚骰子点数之差的绝对值。求 的联合分布律。
解答
骰子点数 共有 种等可能的结果。 ,。 可能的取值为 ,。 通过枚举所有组合:
- 当 时,,组合有 (1,1), (2,2), ..., (6,6)。对应的 分别为 2, 4, 6, 8, 10, 12。每个组合概率为 。
- 当 时,,组合有 (1,2), (2,1), (2,3), (3,2), ..., (5,6), (6,5),共 10 种。 依此类推可以填满分布表。
3. 二维连续型随机变量
定义 联合概率密度函数(Joint Probability Density Function / Joint PDF) 对于二维随机变量 的分布函数 ,如果存在非负函数 ,使得对于任意实数 都有:
则称 为二维连续型随机变量,函数 称为它的联合概率密度函数。
3.1 联合 PDF 的性质
- 。
- 。
- 设 是平面上的一个区域,则点 落在 内的概率为:
- 在 的连续点处,有:
3.2 常见的连续分布
定义 二维均匀分布(Two-dimensional Uniform Distribution) 设 是平面上的一个有界区域,其面积为 。如果 的联合密度函数为:
则称 在区域 上服从均匀分布。
定义 二维正态分布(Bivariate Normal Distribution) 如果二维随机变量 的联合密度函数为:
其中 都是常数,且 ,则称 服从参数为 的二维正态分布,记作 。
参数含义:
- :分别是 和 的均值。
- :分别是 和 的方差。
- : 与 的相关系数。
3.3 连续型例题
例 2:设 的联合密度函数为:
(1) 确定常数 ;(2) 计算 。
解答
(1) 利用联合 PDF 的归一性:
解得 。
(2) 计算概率:
4. 边缘分布
联合分布描述了 的整体分布情况,而其中每一个分量 或 也有自己的分布。
定义 边缘分布函数(Marginal Distribution Function) 二维随机变量 关于 的边缘分布函数记作 ,定义为:
同理,关于 的边缘分布函数为:
4.1 离散型的边缘分布
对于离散型随机变量,其边缘分布律可以通过对联合分布律求和得到。 边缘 PMF 分别为:
在分布表中,这对应于将各行或各列的概率加总。
4.2 连续型的边缘分布
对于连续型随机变量,通过积分消去不需要的变量: 边缘 PDF 分别为:
如果 在区域 上服从均匀分布,那么 在 轴上的投影区间内可能不再是均匀分布。
二维正态分布的边缘分布: 若 ,则其边缘分布仍为正态分布:
证明时需要对 进行配方并对另一个变量在 积分。
重要结论:
- 联合分布可以唯一确定边缘分布。
- 边缘分布通常不能唯一确定联合分布。
反例说明: 设 和 都服从标准正态分布 。 如果 和 独立,其联合密度为 。 如果我们构造另一个分布,比如在某些对称点上改变密度但不改变投影积和,其边缘分布依然是 ,但联合分布已经改变。 这意味着两个分量的个体特征(边缘分布)不足以还原它们之间的相互关系(联合分布)。
4.3 边缘分布例题
例 2:已知 服从单位圆 上的均匀分布,求 。
解答
由题意,,联合密度为:
求 ,对 积分。固定 , 的范围是 。
当 时,。
4.4 连续型边缘分布例题
例 4:已知 的联合密度函数为:
(1) 求边缘密度 和 ;(2) 判断 和 是否独立。
解答
(1) 边缘密度:
(2) 判断独立性:
因此, 和 相互独立。
5. 条件分布
定义 条件分布(Conditional Distribution) 在已知其中一个随机变量取值的条件下,另一个随机变量的概率分布称为条件分布。
5.1 离散型条件分布
设 是离散型随机变量,对于固定的 ,若 ,则在 的条件下, 的条件分布律为:
5.2 连续型条件分布
对于连续型随机变量,不能直接使用 因为该概率为 0。我们利用极限过程定义。
定义 条件概率密度函数(Conditional PDF) 设 的联合密度函数为 ,边缘密度函数为 。在 的点 ,称
为在 的条件下 的条件概率密度函数。
同理,可定义 。
例 3:求二维正态分布的条件分布。 可以证明,若 ,则 仍然是一个一维正态分布。其均值和方差分别是 的线性函数。
5.3 连续型条件分布例题
例 5:设 在区域 上服从均匀分布。求在 的条件下 的条件概率密度。
解答
由题意, 的面积 ,联合密度为:
(1) 求边缘密度 :
(2) 求条件密度 :
当 时,。
6. 随机变量的独立性
定义 随机变量的独立性(Independence of Random Variables) 设 是二维随机变量 的联合分布函数, 分别是其边缘分布函数。如果对于任意实数 ,都有:
则称随机变量 和 是相互独立的。
6.1 独立性的等价条件
- 离散型: 和 独立当且仅当对所有的 ,有:
- 连续型: 和 独立当且仅当在平面上几乎处处成立:
6.2 正态分布的独立性
对于二维正态分布 , 和 相互独立的充要条件是 。 这意味着对于二维正态分布,不相关()与独立是等价的。注意,这在一般分布中并不成立。
6.3 独立性例题
例 6:设 的联合概率分布如下:
(1) 求边缘分布;(2) 判断 与 是否独立。
解答
(1) 边缘分布:
(2) 判断独立性: 由于 ,因此 与 不独立。
7. 两个随机变量函数的分布
已知 的联合分布,求 的分布。
7.1 和的分布与卷积公式
设 是连续型随机变量,其密度函数为 。设 ,则 的分布函数为:
为了求 ,我们先固定 ,对 进行积分,此时 的上限为 :
对 求导(利用变上限积分求导法则):
从而得到卷积公式:
如果 和 独立,则有 ,代入上式得:
由于 和 的对称性,上式也可以写作:
7.2 比值的分布(补)
设 独立,且 ,求 的分布。
求导得:
7.3 最大值与最小值的分布
设 相互独立,分布函数分别为 。
- 最大值 的分布函数:
- 最小值 的分布函数:
例 4:在一个串联系统中,只要有一个部件失效系统就失效。设各部件寿命 独立且服从指数分布,则系统寿命 依然服从指数分布,且参数为各部件参数之和。
7.4 函数分布例题
例 7:设 且相互独立(指数分布),求 的分布。
解答
由题意,;。 利用卷积公式:
这说明独立指数分布之和服从 Erlang 分布。
例 8:在串联系统与并联系统中,设两个部件的寿命 独立且都服从参数为 的指数分布。 (1) 系统串联时的寿命 ; (2) 系统并联时的寿命 。
解答
(1) 串联系统:
寿命服从参数为 的指数分布。
(2) 并联系统:
寿命分布为 。
参考文献
- 《概率论与数理统计》 盛骤等编,第五版
- 概率论基础教程,Sheldon Ross 著