常见离散型随机变量

在概率论的研究中，一些随机试验由于其结构的特殊性，产生出的随机变量往往具有特定的分布规律。本章将详细介绍几类最常用的离散型随机变量，它们是构建复杂概率模型的基础。

1. 0-1 分布（伯努利分布）

定义 0-1 分布（Bernoulli Distribution）设随机变量 $X$ 只取 $0$ 和 $1$ 两个值，且其分布律为 $P(X = 1) = p$ ， $P(X = 0) = 1 - p$ ，其中 $0 < p < 1$ 。这种分布称为 0-1 分布 或 伯努利分布。

其概率质量函数（PMF）可以统一写成：

P(X = k) = p^k (1-p)^{1-k}, \quad k = 0, 1

通常记作 $X \sim B(1, p)$ 或 $X \sim \mathrm{Bernoulli}(p)$ 。

1.1 数字特征

期望： $E[X] = 1 \cdot p + 0 \cdot (1-p) = p$
方差： $\mathrm{Var}(X) = E[X^2] - (E[X])^2 = (1^2 \cdot p + 0^2 \cdot (1-p)) - p^2 = p - p^2 = p(1-p)$

1.2 应用场景与例题

0-1 分布适用于只有两种可能结果的单次试验。例如：硬币投掷（正面或反面）、产品检测（合格或不合格）、考试结果（通过或不通过）。

例题 1：某生产线上的产品合格率为 $0.95$ 。现随机抽取一件产品，令 $X = 1$ 表示产品合格， $X = 0$ 表示产品不合格。求 $X$ 的分布律及期望。

解： $X$ 服从参数为 $p = 0.95$ 的 0-1 分布。分布律为： $P(X = 1) = 0.95$ ， $P(X = 0) = 0.05$ 。期望 $E[X] = p = 0.95$ 。

2. 二项分布

定义 二项分布（Binomial Distribution）设随机变量 $X$ 表示 $n$ 重伯努利试验中“成功”出现的次数，每次试验中“成功”的概率为 $p$ 。则 $X$ 的概率分布称为 二项分布。

其 PMF 为：

P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, \ldots, n

记作 $X \sim B(n, p)$ 。当 $n = 1$ 时，二项分布退化为 0-1 分布。

2.1 期望与方差

对于二项分布 $X \sim B(n, p)$ ，其期望为 $E[X] = np$ ，方差为 $\mathrm{Var}(X) = np(1-p)$ 。

证明

利用期望的线性性质：设 $X = X_1 + X_2 + \cdots + X_n$ ，其中 $X_i$ 是第 $i$ 次试验的 0-1 变量（ $X_i \sim B(1, p)$ ）。由于各次试验相互独立，则：

E[X] = E\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n E[X_i] = \sum_{i=1}^n p = np

\mathrm{Var}(X) = \mathrm{Var}\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n \mathrm{Var}(X_i) = \sum_{i=1}^n p(1-p) = np(1-p)

2.2 最可能值

二项分布的最可能值（众数）是指使 $P(X = k)$ 达到最大的 $k$ 。通过比较 $P(X = k)$ 与 $P(X = k-1)$ 的大小，可以得出：

若 $(n+1)p$ 不是整数，则最可能值为 $k = \lfloor (n+1)p \rfloor$ 。
若 $(n+1)p$ 是整数，则 $k = (n+1)p$ 和 $k = (n+1)p - 1$ 都是最可能值，它们的概率相等且最大。

2.3 应用场景与例题

例题 2：某射击运动员命中目标的概率为 $0.8$ 。现独立射击 $5$ 次，求至少命中 $4$ 次的概率。

解：设 $X$ 为命中次数，则 $X \sim B(5, 0.8)$ 。

P(X \geqslant 4) = P(X=4) + P(X=5) = \binom{5}{4} 0.8^4 (0.2)^1 + \binom{5}{5} 0.8^5 (0.2)^0

P(X \geqslant 4) = 5 \cdot 0.4096 \cdot 0.2 + 1 \cdot 0.32768 = 0.4096 + 0.32768 = 0.73728

例题 3：一批产品的废品率为 $0.1$ 。现从中抽取 $10$ 件，求废品数 $X$ 的期望和方差。

解： $X \sim B(10, 0.1)$ 。 $E[X] = np = 10 \cdot 0.1 = 1$ 。 $\mathrm{Var}(X) = np(1-p) = 10 \cdot 0.1 \cdot 0.9 = 0.9$ 。

3. 泊松分布

定义 泊松分布（Poisson Distribution）如果随机变量 $X$ 的所有可能取值为 $0, 1, 2, \ldots$ ，且分布律为

P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots

其中 $\lambda > 0$ 是常数，则称 $X$ 服从参数为 $\lambda$ 的 泊松分布，记作 $X \sim P(\lambda)$ 或 $X \sim \mathrm{Poisson}(\lambda)$ 。

3.1 期望与方差

对于 $X \sim P(\lambda)$ ：

期望： $E[X] = \lambda$
方差： $\mathrm{Var}(X) = \lambda$

参数 $\lambda$ 的物理意义通常是单位时间（或单位面积、单位空间）内事件发生的平均次数。

3.2 泊松定理

定义 泊松定理（Poisson Theorem）设 $X_n \sim B(n, p_n)$ 。如果当 $n \to \infty$ 时， $np_n \to \lambda$ （ $\lambda > 0$ 是常数），则对于任一固定的 $k$ ，有：

\lim_{n \to \infty} \binom{n}{k} p_n^k (1-p_n)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}

证明

令 $p = \frac{\lambda}{n}$ ，代入二项分布公式：

\binom{n}{k} p^k (1-p)^{n-k} = \frac{n(n-1)\cdots(n-k+1)}{k!} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k}

= \frac{\lambda^k}{k!} \cdot \frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} \cdot \left(1 - \frac{\lambda}{n}\right)^n \cdot \left(1 - \frac{\lambda}{n}\right)^{-k}

当 $n \to \infty$ 时：

$\frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} \to 1$
$\left(1 - \frac{\lambda}{n}\right)^n \to e^{-\lambda}$
$\left(1 - \frac{\lambda}{n}\right)^{-k} \to 1$ 综上所述，极限值为 $\frac{\lambda^k e^{-\lambda}}{k!}$ 。

3.3 应用场景与例题

泊松分布常用于描述“稀有事件”在大量重复试验中出现的次数。例如：

某段时间内接到的求救电话次数。
放射性物质在单位时间内放射出的粒子数。
书本中每页的印刷错误数。

例题 4：某种电子元件的失效率为 $0.002$ 。现有一批共 $1000$ 个这种元件，求其中失效元件数 $X$ 恰好为 $3$ 的概率。

解： $X \sim B(1000, 0.002)$ 。由于 $n$ 较大且 $p$ 较小，令 $\lambda = np = 1000 \cdot 0.002 = 2$ 。使用泊松近似：

P(X = 3) \approx \frac{2^3 e^{-2}}{3!} = \frac{8}{6} e^{-2} \approx 1.333 \cdot 0.1353 = 0.1804

例题 5：一个电话交换台每分钟平均接到 $3$ 个呼唤。求在某一分钟内接到呼唤次数不少于 $2$ 次的概率。

解：设 $X$ 为呼唤次数，则 $X \sim P(3)$ 。

P(X \geqslant 2) = 1 - P(X < 2) = 1 - (P(X=0) + P(X=1))

P(X \geqslant 2) = 1 - \left( \frac{3^0 e^{-3}}{0!} + \frac{3^1 e^{-3}}{1!} \right) = 1 - (1 + 3)e^{-3} = 1 - 4e^{-3} \approx 1 - 4 \cdot 0.0498 = 0.8008

4. 几何分布

定义 几何分布（Geometric Distribution）在伯努利试验中，若每次试验成功的概率为 $p$ ，令随机变量 $X$ 表示直到首次成功为止所需的试验次数，则称 $X$ 服从参数为 $p$ 的 几何分布。

其 PMF 为：

P(X = k) = (1-p)^{k-1} p, \quad k = 1, 2, 3, \ldots

记作 $X \sim \mathrm{Geo}(p)$ 。

4.1 数字特征

期望： $E[X] = \frac{1}{p}$
方差： $\mathrm{Var}(X) = \frac{1-p}{p^2}$

4.2 无记忆性

定义 无记忆性（Memoryless Property）几何分布具有如下性质：对于任意正整数 $m, n$ ，有

P(X > m + n \mid X > m) = P(X > n)

证明

首先计算 $P(X > k)$ ，这表示前 $k$ 次试验全部失败的概率：

P(X > k) = (1-p)^k

根据条件概率公式：

P(X > m + n \mid X > m) = \frac{P(X > m + n \text{ 且 } X > m)}{P(X > m)} = \frac{P(X > m + n)}{P(X > m)}

= \frac{(1-p)^{m+n}}{(1-p)^m} = (1-p)^n = P(X > n)

这一性质意味着：如果前 $m$ 次试验已经失败，那么再需要试验 $n$ 次才成功的概率，与从头开始试验需要 $n$ 次才成功的概率是相同的。系统没有“记忆”。

4.3 应用场景与例题

例题 6：一个射手命中目标的概率为 $0.2$ 。他不断射击直到命作为止，求他射击次数 $X$ 的期望，以及他需要射击超过 $3$ 次的概率。

解： $X \sim \mathrm{Geo}(0.2)$ 。期望 $E[X] = \frac{1}{0.2} = 5$ 。 $P(X > 3) = (1-0.2)^3 = 0.8^3 = 0.512$ 。

5. 超几何分布

定义 超几何分布（Hypergeometric Distribution）设有 $N$ 件产品，其中有 $M$ 件次品。从中随机不放回地抽取 $n$ 件，令 $X$ 表示抽取的 $n$ 件产品中的次品数。则称 $X$ 服从参数为 $n, M, N$ 的 超几何分布。

其 PMF 为：

P(X = k) = \frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}

其中 $k = \max(0, n - (N - M)), \ldots, \min(n, M)$ 。记作 $X \sim H(n, M, N)$ 。

5.1 期望

对于 $X \sim H(n, M, N)$ ，其期望为：

E[X] = n \cdot \frac{M}{N}

这说明不放回抽样的次品数期望与有放回抽样（二项分布）的期望形式是一致的。

5.2 与二项分布的关系

当总体容量 $N$ 很大时，不放回抽样可以近似看作有放回抽样。即：当 $N \to \infty$ ， $M \to \infty$ 且 $\frac{M}{N} \to p$ 时，超几何分布近似于二项分布 $B(n, p)$ 。

例题 7：从含 $10$ 个红球和 $20$ 个白球的袋中不放回地抽取 $5$ 个球，求抽到红球个数 $X$ 的分布律。

解： $X \sim H(5, 10, 30)$ 。分布律为： $P(X = k) = \frac{\binom{10}{k}\binom{20}{5-k}}{\binom{30}{5}}$ ， $k = 0, 1, 2, 3, 4, 5$ 。

6. 负二项分布

定义 负二项分布（Negative Binomial Distribution）在独立重复的伯努利试验中，设每次试验成功的概率为 $p$ 。令随机变量 $X$ 表示直到出现第 $r$ 次成功时所需的试验总次数，则称 $X$ 服从参数为 $r, p$ 的 负二项分布。

其 PMF 为：

P(X = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}, \quad k = r, r+1, \ldots

记作 $X \sim \mathrm{NB}(r, p)$ 。

6.1 性质

与几何分布的关系：几何分布是 $r = 1$ 时负二项分布的特例。
期望： $E[X] = \frac{r}{p}$
方差： $\mathrm{Var}(X) = \frac{r(1-p)}{p^2}$

7. 常见离散分布总结

下表总结了本章介绍的主要离散分布及其特征：

分布名称	记号	概率质量函数 $P(X=k)$	期望 $E[X]$	方差 $\mathrm{Var}(X)$	主要应用
0-1 分布	$B(1, p)$	$p^k (1-p)^{1-k}, k \in \{0, 1\}$	$p$	$p(1-p)$	单次试验结果
二项分布	$B(n, p)$	$\binom{n}{k} p^k (1-p)^{n-k}, k=0 \ldots n$	$np$	$np(1-p)$	$n$ 重重复试验
泊松分布	$P(\lambda)$	$\frac{\lambda^k e^{-\lambda}}{k!}, k=0, 1 \ldots$	$\lambda$	$\lambda$	稀有事件、排队论
几何分布	$\mathrm{Geo}(p)$	$(1-p)^{k-1} p, k=1, 2 \ldots$	$\frac{1}{p}$	$\frac{1-p}{p^2}$	首次成功时间
超几何分布	$H(n, M, N)$	$\frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}$	$\frac{nM}{N}$	-	不放回抽样
负二项分布	$\mathrm{NB}(r, p)$	$\binom{k-1}{r-1} p^r (1-p)^{k-r}, k=r, r+1 \ldots$	$\frac{r}{p}$	$\frac{r(1-p)}{p^2}$	第 $r$ 次成功时间

分布间的关系

下方的 Mermaid 图展示了这些分布之间的内在联系：

组合数学

不等式

线性代数

数列

数论

概率论

集合论

统计学

三角学

常见离散型随机变量

1. 0-1 分布（伯努利分布）

1.1 数字特征

1.2 应用场景与例题

2. 二项分布

2.1 期望与方差

2.2 最可能值

2.3 应用场景与例题

3. 泊松分布

3.1 期望与方差

3.2 泊松定理

3.3 应用场景与例题

4. 几何分布

4.1 数字特征

4.2 无记忆性

4.3 应用场景与例题

5. 超几何分布

5.1 期望

5.2 与二项分布的关系

6. 负二项分布

6.1 性质

7. 常见离散分布总结

分布间的关系

常见离散型随机变量 ​

1. 0-1 分布（伯努利分布） ​

1.1 数字特征 ​

1.2 应用场景与例题 ​

2. 二项分布 ​

2.1 期望与方差 ​

2.2 最可能值 ​

2.3 应用场景与例题 ​

3. 泊松分布 ​

3.1 期望与方差 ​

3.2 泊松定理 ​

3.3 应用场景与例题 ​

4. 几何分布 ​

4.1 数字特征 ​

4.2 无记忆性 ​

4.3 应用场景与例题 ​

5. 超几何分布 ​

5.1 期望 ​

5.2 与二项分布的关系 ​

6. 负二项分布 ​

6.1 性质 ​

7. 常见离散分布总结 ​

分布间的关系 ​

常见离散型随机变量

1. 0-1 分布（伯努利分布）

1.1 数字特征

1.2 应用场景与例题

2. 二项分布

2.1 期望与方差

2.2 最可能值

2.3 应用场景与例题

3. 泊松分布

3.1 期望与方差

3.2 泊松定理

3.3 应用场景与例题

4. 几何分布

4.1 数字特征

4.2 无记忆性

4.3 应用场景与例题

5. 超几何分布

5.1 期望

5.2 与二项分布的关系

6. 负二项分布

6.1 性质

7. 常见离散分布总结

分布间的关系