条件概率与独立性
1. 条件概率
在许多实际问题中,除了已知的样本空间 外,我们往往还能获得一些额外的信息。这些信息告诉我们某些事件已经发生,从而改变了我们对目标事件发生概率的评估。比如,在掷一枚公平的骰子时,已知点数是偶数,那么点数为 6 的概率就不再是 ,而是 。这种在已知某事件发生的情况下,另一事件发生的概率,就是条件概率。
定义 条件概率(Conditional Probability)设 是两个事件,且 ,则定义在事件 发生的条件下,事件 发生的条件概率为
条件概率依然满足概率论的三条基本公理:
- 非负性:对于任意事件 ,有 。
- 规范性:。
- 可列可加性:若 是两两互斥的事件序列,则
例:一个袋子中有 5 个红球和 3 个白球。如果我们不放回地连续随机抽取两个球。已知第一个球是红球,求第二个球也是红球的概率。
解:设 为“第一次抽到红球”, 为“第二次抽到红球”。 样本空间中共有 8 个球。第一次抽到红球后,袋中剩下 7 个球,其中 4 个是红球。 直观上看,概率应为 。使用公式计算: 。
则
2. 乘法公式
从条件概率的定义可以直接导出计算积事件概率的公式。
定义 乘法公式(Multiplication Rule)设 ,则 ;若 ,则 。
乘法公式可以推广到多个事件的情形。对于 个事件 ,若 ,则有
例:一批产品中有 10 个正品和 2 个次品。为了检查质量,我们不放回地从中逐个抽取产品,直到 2 个次品都被取出。求在第三次抽取时才取出第二个次品的概率。
解:设 为“第 次取出的是次品”。 第三次才取出第二个次品,意味着前两次中有一次是次品,且第三次必须是次品。 所求概率为 。 由于这两个事件互斥,概率为 。 。 。 故所求概率为 。
3. 全概率公式
全概率公式是用于计算复杂事件概率的有力工具。它的核心思想是“化整为零”,将一个复杂的事件根据导致其发生的各种原因进行分解。
定义 划分(Partition)设 为样本空间 的一组事件。如果它们满足:
- 对所有 成立(两两互斥);
- (完备性);
- 对所有 成立;
则称 为样本空间 的一个划分。
定义 全概率公式(Law of Total Probability)设 是样本空间 的一个划分,则对于任意事件 ,有
这个公式可以看作是对 的一种加权平均,权重就是各个原因 发生的概率。
我们可以用树状图来直观表示这种关系:
例:某工厂有三条生产线 A, B, C 生产同一种零件。它们的产量分别占总产量的 25%, 35%, 40%。已知这三条生产线的次品率分别为 5%, 4%, 2%。现从仓库中随机抽取一个零件,求它是次品的概率。
解:设 分别表示零件由 A, B, C 生产线生产,事件 表示零件是次品。 由题意知: 根据全概率公式: 。
4. 贝叶斯公式
全概率公式是“由因求果”,而贝叶斯公式则是“由果溯因”。当我们观察到一个结果发生时,可以用贝叶斯公式推断导致这个结果发生的各种可能原因的概率。
定义 贝叶斯公式(Bayes' Theorem)设 是样本空间 的一个划分,且 ,则对任意 ,有
在贝叶斯推断中,我们区分两个重要的概率概念: 定义 先验概率(Prior Probability)在观察到结果 之前,我们对原因 发生可能性的初步估计 。 定义 后验概率(Posterior Probability)在观察到结果 之后,我们对原因 发生可能性的修正估计 。
例 1(医学检测):某种罕见疾病在人群中的患病率为 0.001。现有一种检测手段,如果一个人患有该病,检测结果呈阳性的概率为 99%(灵敏度);如果一个人未患该病,检测结果呈阳性的概率为 5%(误报率)。如果某人的检测结果呈阳性,求他实际患病的概率。
解:设 为“患病”, 为“检测结果呈阳性”。 已知: 根据贝叶斯公式:
计算结果显示,即使检测呈阳性,此人患病的概率也仅约为 1.94%。这是因为该病极其罕见,庞大的健康人群基数使得误报的绝对数量远超过真实的病例数。
例 2(产品来源):沿用上一节全概率公式的工厂例子。已知随机抽取的一个零件是次品,求它是由 A 生产线生产的概率。
解:。
5. 事件的独立性
独立性是概率论中最重要的概念之一。直观上,如果事件 的发生不影响事件 发生的概率,我们就说 与 相互独立。
定义 两个事件的独立(Independence of Two Events)如果满足
则称事件 与 相互独立(Independent)。
若 与 独立且 ,则根据条件概率定义:
这验证了独立性的直观含义:已知 发生并不改变 的概率。
5.1 独立性与互斥性的区别
这是一个极其容易混淆的概念。互斥意味着两个事件不能同时发生(),而独立意味着一个事件的发生不影响另一个。
| 特性 | 互斥(Mutually Exclusive) | 独立(Independent) |
|---|---|---|
| 定义式 | ||
| 直观含义 | A 发生则 B 必不发生 | A 发生与否不影响 B |
| 关系 | 若 ,则互斥事件一定不独立 | 若 ,则独立事件一定不互斥 |
| 运算 |
5.2 多个事件的独立性
定义 多个事件的相互独立(Mutual Independence)对于 个事件 ,如果对于其中任意 个事件()的子集 ,都有
则称这 个事件相互独立。
需要注意,两两独立(Pairwise Independence)并不等同于相互独立。 反例:考虑样本空间 ,每个样本点概率均为 。 设 。 。 ,故 独立。 同理 和 也独立。 但 。 所以 两两独立,但并不相互独立。
性质:若 与 相互独立,则 与 独立, 与 独立, 与 独立。
证明
证明 与 独立: 由于 且 与 互斥, 有 。 因为 独立,。 所以 。 根据定义, 与 独立。
6. 伯努利试验
伯努利试验是概率论中最简单也最重要的一种随机试验模型。
定义 伯努利试验(Bernoulli Trial)如果一个随机试验只有两个可能的结果,通常称为“成功”和“失败”,则称该试验为伯努利试验。设成功的概率为 (),则失败的概率为 。
定义 重伯努利试验( Bernoulli Trials)将一个伯努利试验在相同条件下独立地重复进行 次,这种试验序列称为 重伯努利试验。
在 重伯努利试验中,事件 (成功)在 次试验中恰好发生 次的概率为:
这就是著名的二项概率公式。
6.1 最概然值
在 次试验中,出现次数 的概率 并不相等。使得 达到最大的 称为最概然值。 可以通过考察比值 来确定。结论是: 若 不是整数,则最概然值为 。 若 是整数,则在 和 处概率同时达到最大。
例:某射击运动员每发子弹命中目标的概率为 0.8。求:
- 独立射击 5 次,恰好命中 3 次的概率。
- 独立射击 5 次,至少命中 1 次的概率。
解:这是一个 的 重伯努利试验。
- 。
- 至少命中 1 次的对立事件是“一次都没命中”。 。 可见,多次射击可以显著提高命中目标(至少一次)的总概率。