随机变量及其分布
在概率论的前两章中,我们讨论了随机试验、样本空间以及事件的概率。虽然这些概念能够描述随机现象,但直接使用集合来描述随机事件在数学处理上存在诸多不便。例如,“掷一枚硬币出现正面” 和 “测量一个零件的直径在 10.0mm 到 10.1mm 之间” 是完全不同的物理过程。为了使用统一的数学工具(如微积分、函数分析)来研究这些现象,我们需要将随机试验的结果数量化。
1. 随机变量的概念
随机变量的引入是概率论发展史上的里程碑,它建立了从随机试验的样本空间到实数集的映射关系。
定义 随机变量(Random Variable)设随机试验的样本空间为 ,如果对于每个 ,都有一个实数 与之对应,则称 为随机变量。
随机变量 实际上是一个定义在 上的实值函数 。
1.1 引入随机变量的意义
- 数量化:将抽象的试验结果(如“正面”、“合格”)转化为具体的数值。
- 分析工具:一旦结果变成了实数,我们就可以利用微积分、级数等数学工具来研究随机现象。
- 事件的表示:随机事件可以用随机变量的取值范围来表示。例如 表示所有使得 的样本点 组成的集合。
1.2 符号约定
- 通常用大写字母 表示随机变量。
- 用小写字母 表示随机变量可能取到的具体实数值。
- 事件 取值在集合 内记作 。
1.3 举例
- 掷骰子:样本空间 。定义 ,则 就是一个随机变量,表示点数。
- 零件测量:测量零件直径, 表示测量得到的具体数值。
2. 分布函数
为了全面描述随机变量的统计规律,我们引入分布函数的概念。它不仅适用于离散型随机变量,也适用于连续型随机变量。
定义 分布函数(Cumulative Distribution Function, CDF)对于随机变量 ,称 为 的分布函数。
2.1 分布函数的性质
分布函数 具有以下三个基本性质:
- 单调不减性:若 ,则 。
证明
因为 ,根据概率的单调性,,即 。
有界性:,且满足:
右连续性:对于任意 ,有 。
2.2 用分布函数计算概率
利用分布函数,我们可以方便地计算随机变量落在任意区间内的概率:
- (左极限)
对于离散型随机变量,其分布函数通常呈现阶梯状,在取值点处发生跳跃,跳跃的高度即为在该点取值的概率。
3. 离散型随机变量
有些随机变量的取值是可以一一列举出来的,这种类型被称为离散型。
定义 离散型随机变量(Discrete Random Variable)如果随机变量 的全部可能取值是有限个或可列无穷多个 ,则称 为离散型随机变量。
定义 概率质量函数(Probability Mass Function, PMF)描述离散型随机变量在各取值点概率的函数称为概率质量函数,记为 。
3.1 PMF 的性质
- 非负性:。
- 规范性:。
定义 概率分布表 离散型随机变量的 PMF 通常用表格形式表示:
3.2 离散型的分布函数
离散型随机变量的分布函数是一个阶梯函数,定义为:
3.3 示例:掷骰子
设 为掷一枚均匀骰子出现的点值。 其分布表为:
| 1 | 2 | 3 | 4 | 5 | 6 | |
|---|---|---|---|---|---|---|
| 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
其分布函数为:
4. 连续型随机变量
对于取值充满整个区间(如长度、时间、重量)的随机变量,我们无法一一列举其取值,其在单点的概率往往为 0。
定义 连续型随机变量(Continuous Random Variable)对于随机变量 的分布函数 ,如果存在非负可积函数 ,使得对于任意实数 ,有 ,则称 为连续型随机变量。
定义 概率密度函数(Probability Density Function, PDF)上述定义中的函数 称为 的概率密度函数。
4.1 PDF 的性质
- 非负性:。
- 规范性:。
- 与分布函数的关系:在 的连续点处,。
- 区间概率:。
4.2 重要说明:单点概率为 0
对于连续型随机变量 ,对于任意实数 ,都有:
这说明:
- 概率为 0 的事件不一定是不可能事件。在连续型分布中,取到任何一个具体确切值的概率都是 0。
- 包含端点不影响概率:。
5. 随机变量函数的分布
在实际应用中,我们常常需要根据已知随机变量 的分布,去求其函数 的分布。
5.1 离散型情况
若 是离散型的,求 的分布非常简单。只需列出 的所有可能取值 及其概率 ,计算相应的 。如果不同的 对应相同的 ,则将它们的概率相加。
5.2 连续型情况:分布函数法
这是最通用的方法。
- 写出 的分布函数定义:。
- 解不等式 ,找到 对应的取值范围 。
- 利用 的密度函数求积分:。
- 对 求导得到 。
5.3 连续型情况:公式法
定义 单调函数密度公式 设 是连续型随机变量,具有密度函数 。又设 是严格单调且处处可导的函数。设 是其反函数,则 是连续型随机变量,其密度函数为:
证明
以 严格单增为例。此时反函数 也严格单增,且 。 对 求导: 若 严格单减,则 ,求导后为 。 由于单减时 ,合并后即为 。
5.4 例题分析
例题 1:线性变换 设 ,求 的分布。 解:,反函数 。导数 。 已知 。 代入公式:
由此可见,。正态变量的线性变换仍为正态变量。
例题 2:平方变换(单区间) 设 在 上服从均匀分布,密度函数 ,求 的分布。 解:当 时,。函数 在该区间严格单增。 反函数 ,。
例题 3:平方变换(全实数) 设 ,求 的分布。 解:注意此时 不是单调函数,必须使用分布函数法。 对于 :
其中 是标准正态分布函数。求导:
这实际上是自由度为 1 的卡方分布 的概率密度函数。
6. 总结与对比
为了更好地理解这两类随机变量,我们进行简单的对比:
| 特性 | 离散型随机变量 | 连续型随机变量 |
|---|---|---|
| 取值 | 有限或可列无穷 | 充满一个或多个区间 |
| 概率描述 | 概率质量函数 (PMF) | 概率密度函数 (PDF) |
| 分布函数 | 阶梯函数 | 积分函数 |
| 单点概率 | 通常 | |
| 规范性 |
随机变量及其分布是概率论的核心基础。后续章节我们将讨论常见的几种分布模型,如二项分布、正态分布等,以及描述随机变量特征的数字特征(期望、方差)。