Skip to content

常见离散型随机变量

在概率论的研究中,一些随机试验由于其结构的特殊性,产生出的随机变量往往具有特定的分布规律。本章将详细介绍几类最常用的离散型随机变量,它们是构建复杂概率模型的基础。

1. 0-1 分布(伯努利分布)

定义 0-1 分布(Bernoulli Distribution)设随机变量 XX 只取 0011 两个值,且其分布律为 P(X=1)=pP(X = 1) = pP(X=0)=1pP(X = 0) = 1 - p,其中 0<p<10 < p < 1。这种分布称为 0-1 分布伯努利分布

其概率质量函数(PMF)可以统一写成:

P(X=k)=pk(1p)1k,k=0,1P(X = k) = p^k (1-p)^{1-k}, \quad k = 0, 1

通常记作 XB(1,p)X \sim B(1, p)XBernoulli(p)X \sim \mathrm{Bernoulli}(p)

1.1 数字特征

  • 期望E[X]=1p+0(1p)=pE[X] = 1 \cdot p + 0 \cdot (1-p) = p
  • 方差Var(X)=E[X2](E[X])2=(12p+02(1p))p2=pp2=p(1p)\mathrm{Var}(X) = E[X^2] - (E[X])^2 = (1^2 \cdot p + 0^2 \cdot (1-p)) - p^2 = p - p^2 = p(1-p)

1.2 应用场景与例题

0-1 分布适用于只有两种可能结果的单次试验。例如:硬币投掷(正面或反面)、产品检测(合格或不合格)、考试结果(通过或不通过)。

例题 1:某生产线上的产品合格率为 0.950.95。现随机抽取一件产品,令 X=1X = 1 表示产品合格,X=0X = 0 表示产品不合格。求 XX 的分布律及期望。

XX 服从参数为 p=0.95p = 0.95 的 0-1 分布。 分布律为:P(X=1)=0.95P(X = 1) = 0.95P(X=0)=0.05P(X = 0) = 0.05。 期望 E[X]=p=0.95E[X] = p = 0.95

2. 二项分布

定义 二项分布(Binomial Distribution)设随机变量 XX 表示 nn 重伯努利试验中“成功”出现的次数,每次试验中“成功”的概率为 pp。则 XX 的概率分布称为 二项分布

其 PMF 为:

P(X=k)=(nk)pk(1p)nk,k=0,1,,nP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, \ldots, n

记作 XB(n,p)X \sim B(n, p)。当 n=1n = 1 时,二项分布退化为 0-1 分布。

2.1 期望与方差

对于二项分布 XB(n,p)X \sim B(n, p),其期望为 E[X]=npE[X] = np,方差为 Var(X)=np(1p)\mathrm{Var}(X) = np(1-p)

证明

利用期望的线性性质:设 X=X1+X2++XnX = X_1 + X_2 + \cdots + X_n,其中 XiX_i 是第 ii 次试验的 0-1 变量(XiB(1,p)X_i \sim B(1, p))。 由于各次试验相互独立,则:

E[X]=E[i=1nXi]=i=1nE[Xi]=i=1np=npE[X] = E\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n E[X_i] = \sum_{i=1}^n p = np

Var(X)=Var[i=1nXi]=i=1nVar(Xi)=i=1np(1p)=np(1p)\mathrm{Var}(X) = \mathrm{Var}\left[\sum_{i=1}^n X_i\right] = \sum_{i=1}^n \mathrm{Var}(X_i) = \sum_{i=1}^n p(1-p) = np(1-p)

2.2 最可能值

二项分布的最可能值(众数)是指使 P(X=k)P(X = k) 达到最大的 kk。 通过比较 P(X=k)P(X = k)P(X=k1)P(X = k-1) 的大小,可以得出:

  • (n+1)p(n+1)p 不是整数,则最可能值为 k=(n+1)pk = \lfloor (n+1)p \rfloor
  • (n+1)p(n+1)p 是整数,则 k=(n+1)pk = (n+1)pk=(n+1)p1k = (n+1)p - 1 都是最可能值,它们的概率相等且最大。

2.3 应用场景与例题

例题 2:某射击运动员命中目标的概率为 0.80.8。现独立射击 55 次,求至少命中 44 次的概率。

:设 XX 为命中次数,则 XB(5,0.8)X \sim B(5, 0.8)

P(X4)=P(X=4)+P(X=5)=(54)0.84(0.2)1+(55)0.85(0.2)0P(X \geqslant 4) = P(X=4) + P(X=5) = \binom{5}{4} 0.8^4 (0.2)^1 + \binom{5}{5} 0.8^5 (0.2)^0

P(X4)=50.40960.2+10.32768=0.4096+0.32768=0.73728P(X \geqslant 4) = 5 \cdot 0.4096 \cdot 0.2 + 1 \cdot 0.32768 = 0.4096 + 0.32768 = 0.73728

例题 3:一批产品的废品率为 0.10.1。现从中抽取 1010 件,求废品数 XX 的期望和方差。

XB(10,0.1)X \sim B(10, 0.1)E[X]=np=100.1=1E[X] = np = 10 \cdot 0.1 = 1Var(X)=np(1p)=100.10.9=0.9\mathrm{Var}(X) = np(1-p) = 10 \cdot 0.1 \cdot 0.9 = 0.9

3. 泊松分布

定义 泊松分布(Poisson Distribution)如果随机变量 XX 的所有可能取值为 0,1,2,0, 1, 2, \ldots,且分布律为

P(X=k)=λkeλk!,k=0,1,2,P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots

其中 λ>0\lambda > 0 是常数,则称 XX 服从参数为 λ\lambda泊松分布,记作 XP(λ)X \sim P(\lambda)XPoisson(λ)X \sim \mathrm{Poisson}(\lambda)

3.1 期望与方差

对于 XP(λ)X \sim P(\lambda)

  • 期望E[X]=λE[X] = \lambda
  • 方差Var(X)=λ\mathrm{Var}(X) = \lambda

参数 λ\lambda 的物理意义通常是单位时间(或单位面积、单位空间)内事件发生的平均次数。

3.2 泊松定理

定义 泊松定理(Poisson Theorem)设 XnB(n,pn)X_n \sim B(n, p_n)。如果当 nn \to \infty 时,npnλnp_n \to \lambdaλ>0\lambda > 0 是常数),则对于任一固定的 kk,有:

limn(nk)pnk(1pn)nk=λkeλk!\lim_{n \to \infty} \binom{n}{k} p_n^k (1-p_n)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}

证明

p=λnp = \frac{\lambda}{n},代入二项分布公式:

(nk)pk(1p)nk=n(n1)(nk+1)k!(λn)k(1λn)nk\binom{n}{k} p^k (1-p)^{n-k} = \frac{n(n-1)\cdots(n-k+1)}{k!} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k}

=λkk!nnn1nnk+1n(1λn)n(1λn)k= \frac{\lambda^k}{k!} \cdot \frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} \cdot \left(1 - \frac{\lambda}{n}\right)^n \cdot \left(1 - \frac{\lambda}{n}\right)^{-k}

nn \to \infty 时:

  • nnn1nnk+1n1\frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} \to 1
  • (1λn)neλ\left(1 - \frac{\lambda}{n}\right)^n \to e^{-\lambda}
  • (1λn)k1\left(1 - \frac{\lambda}{n}\right)^{-k} \to 1 综上所述,极限值为 λkeλk!\frac{\lambda^k e^{-\lambda}}{k!}

3.3 应用场景与例题

泊松分布常用于描述“稀有事件”在大量重复试验中出现的次数。例如:

  • 某段时间内接到的求救电话次数。
  • 放射性物质在单位时间内放射出的粒子数。
  • 书本中每页的印刷错误数。

例题 4:某种电子元件的失效率为 0.0020.002。现有一批共 10001000 个这种元件,求其中失效元件数 XX 恰好为 33 的概率。

XB(1000,0.002)X \sim B(1000, 0.002)。由于 nn 较大且 pp 较小,令 λ=np=10000.002=2\lambda = np = 1000 \cdot 0.002 = 2。 使用泊松近似:

P(X=3)23e23!=86e21.3330.1353=0.1804P(X = 3) \approx \frac{2^3 e^{-2}}{3!} = \frac{8}{6} e^{-2} \approx 1.333 \cdot 0.1353 = 0.1804

例题 5:一个电话交换台每分钟平均接到 33 个呼唤。求在某一分钟内接到呼唤次数不少于 22 次的概率。

:设 XX 为呼唤次数,则 XP(3)X \sim P(3)

P(X2)=1P(X<2)=1(P(X=0)+P(X=1))P(X \geqslant 2) = 1 - P(X < 2) = 1 - (P(X=0) + P(X=1))

P(X2)=1(30e30!+31e31!)=1(1+3)e3=14e3140.0498=0.8008P(X \geqslant 2) = 1 - \left( \frac{3^0 e^{-3}}{0!} + \frac{3^1 e^{-3}}{1!} \right) = 1 - (1 + 3)e^{-3} = 1 - 4e^{-3} \approx 1 - 4 \cdot 0.0498 = 0.8008

4. 几何分布

定义 几何分布(Geometric Distribution)在伯努利试验中,若每次试验成功的概率为 pp,令随机变量 XX 表示直到首次成功为止所需的试验次数,则称 XX 服从参数为 pp几何分布

其 PMF 为:

P(X=k)=(1p)k1p,k=1,2,3,P(X = k) = (1-p)^{k-1} p, \quad k = 1, 2, 3, \ldots

记作 XGeo(p)X \sim \mathrm{Geo}(p)

4.1 数字特征

  • 期望E[X]=1pE[X] = \frac{1}{p}
  • 方差Var(X)=1pp2\mathrm{Var}(X) = \frac{1-p}{p^2}

4.2 无记忆性

定义 无记忆性(Memoryless Property)几何分布具有如下性质:对于任意正整数 m,nm, n,有

P(X>m+nX>m)=P(X>n)P(X > m + n \mid X > m) = P(X > n)

证明

首先计算 P(X>k)P(X > k),这表示前 kk 次试验全部失败的概率:

P(X>k)=(1p)kP(X > k) = (1-p)^k

根据条件概率公式:

P(X>m+nX>m)=P(X>m+n 且 X>m)P(X>m)=P(X>m+n)P(X>m)P(X > m + n \mid X > m) = \frac{P(X > m + n \text{ 且 } X > m)}{P(X > m)} = \frac{P(X > m + n)}{P(X > m)}

=(1p)m+n(1p)m=(1p)n=P(X>n)= \frac{(1-p)^{m+n}}{(1-p)^m} = (1-p)^n = P(X > n)

这一性质意味着:如果前 mm 次试验已经失败,那么再需要试验 nn 次才成功的概率,与从头开始试验需要 nn 次才成功的概率是相同的。系统没有“记忆”。

4.3 应用场景与例题

例题 6:一个射手命中目标的概率为 0.20.2。他不断射击直到命作为止,求他射击次数 XX 的期望,以及他需要射击超过 33 次的概率。

XGeo(0.2)X \sim \mathrm{Geo}(0.2)。 期望 E[X]=10.2=5E[X] = \frac{1}{0.2} = 5P(X>3)=(10.2)3=0.83=0.512P(X > 3) = (1-0.2)^3 = 0.8^3 = 0.512

5. 超几何分布

定义 超几何分布(Hypergeometric Distribution)设有 NN 件产品,其中有 MM 件次品。从中随机不放回地抽取 nn 件,令 XX 表示抽取的 nn 件产品中的次品数。则称 XX 服从参数为 n,M,Nn, M, N超几何分布

其 PMF 为:

P(X=k)=(Mk)(NMnk)(Nn)P(X = k) = \frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}

其中 k=max(0,n(NM)),,min(n,M)k = \max(0, n - (N - M)), \ldots, \min(n, M)。记作 XH(n,M,N)X \sim H(n, M, N)

5.1 期望

对于 XH(n,M,N)X \sim H(n, M, N),其期望为:

E[X]=nMNE[X] = n \cdot \frac{M}{N}

这说明不放回抽样的次品数期望与有放回抽样(二项分布)的期望形式是一致的。

5.2 与二项分布的关系

当总体容量 NN 很大时,不放回抽样可以近似看作有放回抽样。即: 当 NN \to \inftyMM \to \inftyMNp\frac{M}{N} \to p 时,超几何分布近似于二项分布 B(n,p)B(n, p)

例题 7:从含 1010 个红球和 2020 个白球的袋中不放回地抽取 55 个球,求抽到红球个数 XX 的分布律。

XH(5,10,30)X \sim H(5, 10, 30)。 分布律为:P(X=k)=(10k)(205k)(305)P(X = k) = \frac{\binom{10}{k}\binom{20}{5-k}}{\binom{30}{5}}k=0,1,2,3,4,5k = 0, 1, 2, 3, 4, 5

6. 负二项分布

定义 负二项分布(Negative Binomial Distribution)在独立重复的伯努利试验中,设每次试验成功的概率为 pp。令随机变量 XX 表示直到出现第 rr 次成功时所需的试验总次数,则称 XX 服从参数为 r,pr, p负二项分布

其 PMF 为:

P(X=k)=(k1r1)pr(1p)kr,k=r,r+1,P(X = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r}, \quad k = r, r+1, \ldots

记作 XNB(r,p)X \sim \mathrm{NB}(r, p)

6.1 性质

  • 与几何分布的关系:几何分布是 r=1r = 1 时负二项分布的特例。
  • 期望E[X]=rpE[X] = \frac{r}{p}
  • 方差Var(X)=r(1p)p2\mathrm{Var}(X) = \frac{r(1-p)}{p^2}

7. 常见离散分布总结

下表总结了本章介绍的主要离散分布及其特征:

分布名称记号概率质量函数 P(X=k)P(X=k)期望 E[X]E[X]方差 Var(X)\mathrm{Var}(X)主要应用
0-1 分布B(1,p)B(1, p)pk(1p)1k,k{0,1}p^k (1-p)^{1-k}, k \in \{0, 1\}ppp(1p)p(1-p)单次试验结果
二项分布B(n,p)B(n, p)(nk)pk(1p)nk,k=0n\binom{n}{k} p^k (1-p)^{n-k}, k=0 \ldots nnpnpnp(1p)np(1-p)nn 重重复试验
泊松分布P(λ)P(\lambda)λkeλk!,k=0,1\frac{\lambda^k e^{-\lambda}}{k!}, k=0, 1 \ldotsλ\lambdaλ\lambda稀有事件、排队论
几何分布Geo(p)\mathrm{Geo}(p)(1p)k1p,k=1,2(1-p)^{k-1} p, k=1, 2 \ldots1p\frac{1}{p}1pp2\frac{1-p}{p^2}首次成功时间
超几何分布H(n,M,N)H(n, M, N)(Mk)(NMnk)(Nn)\frac{\binom{M}{k}\binom{N-M}{n-k}}{\binom{N}{n}}nMN\frac{nM}{N}-不放回抽样
负二项分布NB(r,p)\mathrm{NB}(r, p)(k1r1)pr(1p)kr,k=r,r+1\binom{k-1}{r-1} p^r (1-p)^{k-r}, k=r, r+1 \ldotsrp\frac{r}{p}r(1p)p2\frac{r(1-p)}{p^2}rr 次成功时间

分布间的关系

下方的 Mermaid 图展示了这些分布之间的内在联系: