随机变量的数字特征
在前面的章节中,我们学习了随机变量及其分布。分布函数、概率分布列或概率密度函数能够完整地描述随机变量的统计规律。但在实际应用中,有时我们并不需要或者无法得到完整的分布信息,而仅仅关心随机变量的某些特定特征,例如它的平均值是多少,取值的离散程度如何,或者两个随机变量之间是否存在线性相关关系。这些能够描述随机变量分布某些侧面特征的数值被称为 数字特征(Numerical Characteristics)。
1. 数学期望
数学期望是随机变量最重要的数字特征,它反映了随机变量取值的平均水平。
定义 数学期望(Mathematical Expectation)或 均值(Mean)设随机变量 的分布为:
- 若 为离散型随机变量,其概率分布为 (),若级数 绝对收敛,则称该级数的和为 的数学期望,记为:
- 若 为连续型随机变量,其概率密度函数为 ,若积分 绝对收敛,则称该积分为 的数学期望,记为:
注意:若级数或积分不绝对收敛,则称 的数学期望不存在。
定义 随机变量函数的期望(Expectation of a Function of a Random Variable)设 是随机变量 的函数:
- 若 为离散型,则:
- 若 为连续型,则:
对于二维随机向量 的函数 ,其期望为:
这一公式的重要意义在于:计算 的期望时,不需要先求出 的分布,直接利用 的分布即可计算。
1.1 数学期望的性质
- 常数的期望:设 是常数,则 。
- 线性性质(齐次性):设 是常数,则 。
- 可加性:。
说明
注意,期望的可加性对于任意两个随机变量 和 都成立,不需要独立性条件。这是期望非常优良的性质。
- 独立变量乘积的期望:若 与 相互独立,则 。
- 单调性:若 ,则 ;进一步,若 ,则 。
1.2 常见分布的数学期望
| 分布名称 | 参数 | 数学期望 |
|---|---|---|
| 0-1 分布 | ||
| 二项分布 | ||
| 泊松分布 | ||
| 几何分布 | ||
| 均匀分布 | ||
| 指数分布 | ||
| 正态分布 | ||
| 伽马分布 |
2. 方差
数学期望虽然描述了随机变量的中心位置,但无法反映取值的波动程度。
定义 方差(Variance)设 是一个随机变量,若 存在,则称其为 的方差,记为 或 :
定义 标准差(Standard Deviation)称方差的算术平方根为 的标准差或均方差,记为 :
2.1 方差的计算与性质
在实际计算中,利用以下公式通常更为简便:
证明
方差的性质:
- 常数的方差:。
- 线性性质:。
- 平移不变性:。
- 独立变量和的方差:若 与 相互独立,则 。
- 非负性:,且 的充分必要条件是 (即 以概率 1 取常数值)。
2.2 常见分布的方差
| 分布名称 | 参数 | 方差 |
|---|---|---|
| 0-1 分布 | ||
| 二项分布 | ||
| 泊松分布 | ||
| 几何分布 | ||
| 均匀分布 | ||
| 指数分布 | ||
| 正态分布 | ||
| 伽马分布 |
2.3 切比雪夫不等式
如果我们只知道随机变量的期望和方差,就可以利用切比雪夫不等式来估计随机变量偏离其均值的概率。
定义 切比雪夫不等式(Chebyshev's Inequality)设随机变量 的数学期望 和方差 均存在,则对任意 ,有:
证明
以连续型为例,设 的密度函数为 ,则:
切比雪夫不等式的意义在于:它给出了在分布未知的情况下,通过期望和方差对随机变量取值概率的一个粗略上界估计。即使分布形式完全不知道,只要方差越小,随机变量集中在均值附近的概率就越大。
3. 协方差与相关系数
对于二维随机变量 ,除了各自的期望和方差外,我们还需要描述它们之间的相互关系。
定义 协方差(Covariance)称 为随机变量 与 的协方差,记为 :
常用的计算公式为:
协方差的性质:
- 。
- 对称性:。
- 线性性:。
- 可加性:。
- 和的方差公式:
当 独立时,,上式简化为方差的可加性。
定义 相关系数(Correlation Coefficient)称
为随机变量 与 的相关系数。
相关系数的性质:
- 有界性:。
证明
利用 Cauchy-Schwarz 不等式。设 ,,则 。根据 Cauchy-Schwarz 不等式:
故 。
- 线性相关性: 的充分必要条件是存在常数 (),使得 。
- 不相关:若 ,称 与 不相关(Uncorrelated)。
3.1 独立与不相关的关系
这是一个非常关键的概念,需要明确区分:
- 独立 不相关:如果 与 相互独立,则 ,从而 ,故 。
- 不相关 独立:不相关仅仅说明两者之间不存在 线性 相关关系,但可能存在非线性的函数关系。 例: 设 ,。虽然 严格由 决定,但可以计算出 (正态分布奇数阶矩为 0),即 与 不相关,但显然不独立。
- 特例:对于 二维正态分布,独立性与不相关性是等价的。
4. 矩与协方差矩阵
定义 阶原点矩(-th Moment)称 为 的 阶原点矩()。 定义 阶中心矩(-th Central Moment)称 为 的 阶中心矩。
显然,期望是一阶原点矩,方差是二阶中心矩。
定义 矩母函数(Moment Generating Function, MGF)设 是随机变量,若对于 在 0 附近的某个邻域内,期望 存在,则称
为 的矩母函数。
矩母函数的性质:
- 生成矩: 在 处的 阶导数等于 的 阶原点矩:
- 唯一性:如果两个随机变量的矩母函数在 0 的某个邻域内相等,则它们的分布相同。
定义 协方差矩阵(Covariance Matrix)对于 维随机向量 ,其协方差矩阵定义为 ,其中 :
协方差矩阵具有对称性和半正定性。在多维正态分布 中,协方差矩阵 完整地描述了各分量之间的相关关系。