Skip to content

常见连续型随机变量

在概率论的学习中,连续型随机变量(Continuous Random Variables)的处理方式与离散型完全不同。本章将详细探讨几种在自然科学、社会科学和工程实践中最常用的连续型分布。

1. 均匀分布

定义 均匀分布(Uniform Distribution)若随机变量 XX 在区间 [a,b][a, b] 上具有等可能的取值特性,其概率密度函数(PDF)在区间内为常数,则称 XX 服从参数为 a,ba, b 的均匀分布,记作 XU(a,b)X \sim U(a, b)

1.1 概率密度函数与分布函数

均匀分布的概率密度函数为:

f(x)={1ba,axb0,其他f(x) = \begin{cases} \dfrac{1}{b-a}, & a \leqslant x \leqslant b \\ 0, & \text{其他} \end{cases}

其累积分布函数(CDF)为:

F(x)=P(Xx)={0,x<axaba,ax<b1,xbF(x) = P(X \leqslant x) = \begin{cases} 0, & x < a \\ \dfrac{x-a}{b-a}, & a \leqslant x < b \\ 1, & x \geqslant b \end{cases}

1.2 期望与方差

均匀分布的数学期望反映了区间的中心位置,而方差反映了区间的宽度:

  • 期望E[X]=abx1badx=a+b2E[X] = \displaystyle\int_a^b x \cdot \frac{1}{b-a} \, \mathrm{d}x = \frac{a+b}{2}
  • 方差Var(X)=E[X2](E[X])2=(ba)212\mathrm{Var}(X) = E[X^2] - (E[X])^2 = \frac{(b-a)^2}{12}

1.3 应用与例题

均匀分布是几何概型在连续空间上的直接体现。它常用于描述由于舍入误差产生的随机波动,或者作为计算机生成伪随机数的基础。

例题 1:某路公交车每 10 分钟一班。某乘客随机到达站台,求其等车时间 XX 超过 7 分钟的概率。

解答

由题意,XU(0,10)X \sim U(0, 10)。概率密度函数为 f(x)=1/10,x[0,10]f(x) = 1/10, x \in [0, 10]。 则 P(X>7)=710110dx=0.3P(X > 7) = \displaystyle\int_7^{10} \frac{1}{10} \, \mathrm{d}x = 0.3

2. 指数分布

定义 指数分布(Exponential Distribution)若随机变量 XX 描述了两个独立事件发生之间的时间间隔,其概率密度函数具有指数衰减形式,则称 XX 服从参数为 λ\lambda 的指数分布,记作 XExp(λ)X \sim \mathrm{Exp}(\lambda)

2.1 PDF 与 CDF

对于 λ>0\lambda > 0,其概率密度函数为:

f(x)={λeλx,x00,x<0f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \geqslant 0 \\ 0, & x < 0 \end{cases}

对应的分布函数为:

F(x)={1eλx,x00,x<0F(x) = \begin{cases} 1 - e^{-\lambda x}, & x \geqslant 0 \\ 0, & x < 0 \end{cases}

2.2 期望与方差

  • 期望E[X]=1λE[X] = \frac{1}{\lambda}
  • 方差Var(X)=1λ2\mathrm{Var}(X) = \frac{1}{\lambda^2}

2.3 无记忆性

定义 无记忆性(Memoryless Property)是指对于任意 s,t>0s, t > 0,满足 P(X>s+tX>s)=P(X>t)P(X > s + t \mid X > s) = P(X > t)。这意味着如果一个元件已经工作了 ss 小时,它能再工作 tt 小时的条件概率,与它从初始时刻开始工作 tt 小时的概率相同。

证明

由条件概率公式:

P(X>s+tX>s)=P(X>s+t,X>s)P(X>s)=P(X>s+t)P(X>s)P(X > s+t \mid X > s) = \frac{P(X > s+t, X > s)}{P(X > s)} = \frac{P(X > s+t)}{P(X > s)}

由于 P(X>x)=1F(x)=eλxP(X > x) = 1 - F(x) = e^{-\lambda x},代入得:

eλ(s+t)eλs=eλt=P(X>t)\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}} = e^{-\lambda t} = P(X > t)

证毕。指数分布是唯一具有无记忆性的连续型分布。

2.4 应用与例题

指数分布广泛应用于可靠性工程和排队论。它常被用来模拟电子元件的寿命或泊松过程中相邻两次事件发生的时间间隔。

例题 2:已知某元器件的使用寿命 XX 服从参数为 λ=0.01\lambda = 0.01 的指数分布(单位:小时)。 (1) 求该元器件平均寿命。 (2) 若该元器件已使用了 50 小时,求它还能继续使用超过 100 小时的概率。

解答

(1) 期望 E[X]=1/λ=100E[X] = 1/\lambda = 100 小时。 (2) 根据无记忆性,P(X>50+100X>50)=P(X>100)=e0.01×100=e10.3679P(X > 50 + 100 \mid X > 50) = P(X > 100) = e^{-0.01 \times 100} = e^{-1} \approx 0.3679

3. 正态分布

正态分布是概率论与数理统计中最重要的分布。由于中心极限定理的作用,许多随机现象的叠加最终都会趋向于正态分布。

定义 正态分布(Normal Distribution)亦称 高斯分布(Gaussian Distribution)。若随机变量 XX 的概率密度函数为:

f(x)=12πσe(xμ)22σ2,<x<+f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}, \quad -\infty < x < +\infty

则称 XX 服从参数为 μ,σ2\mu, \sigma^2 的正态分布,记作 XN(μ,σ2)X \sim N(\mu, \sigma^2)

3.1 参数与图形特征

  • 位置参数 μ\mu:决定了钟形曲线的中心位置。
  • 尺度参数 σ\sigma:决定了曲线的平缓程度。σ\sigma 越大,数据越分散,曲线越矮胖;σ\sigma 越小,数据越集中,曲线越瘦高。

PDF 曲线关于 x=μx = \mu 对称,在 x=μx = \mu 处取得最大值 1/(2πσ)1/(\sqrt{2\pi}\sigma)

3.2 期望与方差

  • 期望E[X]=μE[X] = \mu
  • 方差Var(X)=σ2\mathrm{Var}(X) = \sigma^2

3.3 标准正态分布

定义 标准正态分布(Standard Normal Distribution)当 μ=0,σ=1\mu = 0, \sigma = 1 时,称 XX 服从标准正态分布。

其 PDF 记为 φ(x)\varphi(x),CDF 记为 Φ(x)\Phi(x)

φ(x)=12πex22,Φ(x)=xφ(t)dt\varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}, \quad \Phi(x) = \int_{-\infty}^x \varphi(t) \, \mathrm{d}t

由于对称性,有 Φ(x)=1Φ(x)\Phi(-x) = 1 - \Phi(x)

3.4 标准化处理

定义 标准化(Standardization)若 XN(μ,σ2)X \sim N(\mu, \sigma^2),则随机变量 Z=XμσZ = \dfrac{X - \mu}{\sigma} 服从标准正态分布 N(0,1)N(0, 1)

这一性质允许我们利用标准正态分布表来计算一般正态分布的概率:

P(a<Xb)=P(aμσ<Xμσbμσ)=Φ(bμσ)Φ(aμσ)P(a < X \leqslant b) = P\left( \frac{a-\mu}{\sigma} < \frac{X-\mu}{\sigma} \leqslant \frac{b-\mu}{\sigma} \right) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)

3.5 3σ3\sigma 原则

在实际应用中,正态分布的数值往往集中在均值附近。常见的区间概率如下:

  • P(μσ<X<μ+σ)0.6826P(\mu - \sigma < X < \mu + \sigma) \approx 0.6826
  • P(μ2σ<X<μ+2σ)0.9544P(\mu - 2\sigma < X < \mu + 2\sigma) \approx 0.9544
  • P(μ3σ<X<μ+3σ)0.9974P(\mu - 3\sigma < X < \mu + 3\sigma) \approx 0.9974

这被称为 3σ3\sigma 原则。在质量控制中,如果观测值落在 μ±3σ\mu \pm 3\sigma 之外,通常认为发生了非随机性的异常。

3.6 线性性质与地位

XN(μ,σ2)X \sim N(\mu, \sigma^2),则对于常数 a0,ba \neq 0, b,有 aX+bN(aμ+b,a2σ2)aX + b \sim N(a\mu + b, a^2\sigma^2)

正态分布之所以重要,是因为根据中心极限定理,大量独立、同分布的微小随机变量之和,无论原分布是什么,其和都趋向于正态分布。有关详细讨论请参见 第八章:极限定理

3.7 例题

例题 3:某次考试成绩 XX 服从正态分布 N(70,100)N(70, 100)。 (1) 求及格(成绩 60\geqslant 60)的比例。 (2) 如果只有前 10% 的学生能获得 A,求 A 的分数线。

解答

(1) μ=70,σ=10\mu = 70, \sigma = 10P(X60)=1P(X<60)=1Φ(607010)=1Φ(1)=Φ(1)0.8413P(X \geqslant 60) = 1 - P(X < 60) = 1 - \Phi\left(\frac{60-70}{10}\right) = 1 - \Phi(-1) = \Phi(1) \approx 0.8413。 (2) 设分数线为 kk,则 P(X>k)=0.1P(Xk)=0.9P(X > k) = 0.1 \Rightarrow P(X \leqslant k) = 0.9Φ(k7010)=0.9\Phi\left(\frac{k-70}{10}\right) = 0.9。查表得 Φ(1.28)0.9\Phi(1.28) \approx 0.9,故 k7010=1.28k=82.8\frac{k-70}{10} = 1.28 \Rightarrow k = 82.8

例题 4:某种零件的直径 XN(10,0.052)X \sim N(10, 0.05^2)(单位:mm)。如果直径偏差超过 0.1mm 即为废品,求废品率。

解答

废品率为 P(X10>0.1)=1P(X100.1)P(|X - 10| > 0.1) = 1 - P(|X - 10| \leqslant 0.1)P(X100.1)=P(100.1X10+0.1)=P(μ2σXμ+2σ)0.9544P(|X - 10| \leqslant 0.1) = P(10 - 0.1 \leqslant X \leqslant 10 + 0.1) = P(\mu - 2\sigma \leqslant X \leqslant \mu + 2\sigma) \approx 0.9544。 废品率为 10.9544=0.04561 - 0.9544 = 0.0456

4. 伽马分布

定义 伽马函数(Gamma Function)定义为:

Γ(α)=0+tα1etdt,α>0\Gamma(\alpha) = \int_0^{+\infty} t^{\alpha-1} e^{-t} \, \mathrm{d}t, \quad \alpha > 0

该函数具有以下重要性质:

  • Γ(α+1)=αΓ(α)\Gamma(\alpha + 1) = \alpha \Gamma(\alpha)
  • 对于正整数 nnΓ(n+1)=n!\Gamma(n+1) = n!
  • Γ(1/2)=π\Gamma(1/2) = \sqrt{\pi}

定义 伽马分布(Gamma Distribution)若随机变量 XX 的概率密度函数为:

f(x)={λαΓ(α)xα1eλx,x>00,x0f(x) = \begin{cases} \dfrac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}, & x > 0 \\ 0, & x \leqslant 0 \end{cases}

则称 XX 服从形状参数为 α\alpha、逆尺度参数为 λ\lambda 的伽马分布,记作 XGa(α,λ)X \sim \mathrm{Ga}(\alpha, \lambda)

4.1 期望与方差

  • 期望E[X]=αλE[X] = \frac{\alpha}{\lambda}
  • 方差Var(X)=αλ2\mathrm{Var}(X) = \frac{\alpha}{\lambda^2}

4.2 特殊情形

  • α=1\alpha = 1 时,伽马分布退化为指数分布 Exp(λ)\mathrm{Exp}(\lambda)
  • α=n/2,λ=1/2\alpha = n/2, \lambda = 1/2 时,伽马分布演变为 卡方分布 χ2(n)\chi^2(n),这是统计推断中的核心分布之一。

5. 贝塔分布

定义 贝塔函数(Beta Function)定义为:

B(α,β)=01tα1(1t)β1dt=Γ(α)Γ(β)Γ(α+β),α,β>0B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} \, \mathrm{d}t = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}, \quad \alpha, \beta > 0

定义 贝塔分布(Beta Distribution)若随机变量 XX 的概率密度函数为:

f(x)={1B(α,β)xα1(1x)β1,0<x<10,其他f(x) = \begin{cases} \dfrac{1}{B(\alpha, \beta)} x^{\alpha-1}(1-x)^{\beta-1}, & 0 < x < 1 \\ 0, & \text{其他} \end{cases}

则称 XX 服从参数为 α,β\alpha, \beta 的贝塔分布,记作 XBe(α,β)X \sim \mathrm{Be}(\alpha, \beta)

5.1 期望与方差

  • 期望E[X]=αα+βE[X] = \dfrac{\alpha}{\alpha + \beta}
  • 方差Var(X)=αβ(α+β)2(α+β+1)\mathrm{Var}(X) = \dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}

5.2 特点与应用

  • α=β=1\alpha = \beta = 1 时,f(x)=1f(x) = 1,贝塔分布退化为标准均匀分布 U(0,1)U(0, 1)
  • 贝塔分布常被用作贝叶斯统计中的先验分布,特别是对于伯努利试验的成功概率进行建模。

6. 常见连续分布总结

下表汇总了本章介绍的主要连续型随机变量:

分布名称记号概率密度函数 f(x)f(x)期望 E[X]E[X]方差 Var(X)\mathrm{Var}(X)备注
均匀分布U(a,b)U(a, b)1/(ba),axb1/(b-a), a \leqslant x \leqslant b(a+b)/2(a+b)/2(ba)2/12(b-a)^2/12等可能性,舍入误差
指数分布Exp(λ)\mathrm{Exp}(\lambda)λeλx,x0\lambda e^{-\lambda x}, x \geqslant 01/λ1/\lambda1/λ21/\lambda^2无记忆性,寿命建模
正态分布N(μ,σ2)N(\mu, \sigma^2)12πσe(xμ)2/2σ2\frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/2\sigma^2}μ\muσ2\sigma^2钟形曲线,中心极限定理
伽马分布Ga(α,λ)\mathrm{Ga}(\alpha, \lambda)λαΓ(α)xα1eλx\frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}α/λ\alpha/\lambdaα/λ2\alpha/\lambda^2等待第 α\alpha 次事件发生
贝塔分布Be(α,β)\mathrm{Be}(\alpha, \beta)1B(α,β)xα1(1x)β1\frac{1}{B(\alpha, \beta)} x^{\alpha-1}(1-x)^{\beta-1}αα+β\frac{\alpha}{\alpha+\beta}αβ(α+β)2(α+β+1)\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}描述 (0,1)(0, 1) 区间的概率

分布间的关系:

  1. 指数分布是 α=1\alpha=1 的伽马分布。
  2. U(0,1)U(0, 1)α=1,β=1\alpha=1, \beta=1 的贝塔分布。
  3. 多个独立指数分布 Exp(λ)\mathrm{Exp}(\lambda) 之和服从伽马分布。
  4. 标准正态分布变量的平方服从自由度为 1 的卡方分布(即 α=1/2,λ=1/2\alpha=1/2, \lambda=1/2 的伽马分布)。