Skip to content

多维随机变量及其分布

1. 二维随机变量及其联合分布

在实际问题中,单单研究一个随机变量往往是不够的。比如在研究某种疾病时,医生可能需要同时观测患者的体温 XX 和血压 YY。这就引出了多维随机变量的概念。

定义 二维随机变量(Two-dimensional Random Variable) 设 EE 是一个随机试验,它的样本空间是 S={e}S = \{e\}。设 X(e)X(e)Y(e)Y(e) 是定义在 SS 上的两个随机变量。由它们构成的向量 (X,Y)(X, Y) 称为二维随机变量或二维随机向量。

定义 联合分布函数(Joint Distribution Function / Joint CDF) 设 (X,Y)(X, Y) 是二维随机变量,对于任意实数 x,yx, y,称

F(x,y)=P(Xx,Yy)F(x, y) = P(X \leqslant x, Y \leqslant y)

为二维随机变量 (X,Y)(X, Y) 的联合分布函数。

从几何上看,如果将 (X,Y)(X, Y) 看作平面上的点,那么 F(x,y)F(x, y) 就是随机点 (X,Y)(X, Y) 落在以 (x,y)(x, y) 为右上顶点的无穷矩形区域中的概率。

1.1 联合分布函数的性质

联合分布函数 F(x,y)F(x, y) 具有以下基本性质:

  1. 单调性F(x,y)F(x, y) 分别关于 xxyy 是单调不减的。即当 x1<x2x_1 < x_2 时,F(x1,y)F(x2,y)F(x_1, y) \leqslant F(x_2, y);当 y1<y2y_1 < y_2 时,F(x,y1)F(x,y2)F(x, y_1) \leqslant F(x, y_2)
  2. 有界性:对于任意的 x,yx, y0F(x,y)10 \leqslant F(x, y) \leqslant 1。且有:
    • F(,y)=limxF(x,y)=0F(-\infty, y) = \lim_{x \to -\infty} F(x, y) = 0
    • F(x,)=limyF(x,y)=0F(x, -\infty) = \lim_{y \to -\infty} F(x, y) = 0
    • F(,)=0F(-\infty, -\infty) = 0
    • F(+,+)=1F(+\infty, +\infty) = 1
  3. 右连续性F(x,y)F(x, y) 分别关于 xxyy 都是右连续的。
  4. 非负性:对于任意实数 a<ba < bc<dc < d,随机点 (X,Y)(X, Y) 落在矩形区域 a<Xb,c<Yda < X \leqslant b, c < Y \leqslant d 的概率为:

    P(a<Xb,c<Yd)=F(b,d)F(a,d)F(b,c)+F(a,c)0P(a < X \leqslant b, c < Y \leqslant d) = F(b, d) - F(a, d) - F(b, c) + F(a, c) \geqslant 0

1.2 联合分布函数的计算例题

例 1:设二维随机变量 (X,Y)(X, Y) 的联合分布函数为:

F(x,y)={(1eax)(1eby),x>0,y>00,其他F(x, y) = \begin{cases} (1 - e^{-ax})(1 - e^{-by}), & x > 0, y > 0 \\ 0, & \text{其他} \end{cases}

其中 a>0,b>0a > 0, b > 0。求随机点 (X,Y)(X, Y) 落在矩形区域 {0<X1,0<Y1}\{0 < X \leqslant 1, 0 < Y \leqslant 1\} 内的概率。

解答

利用性质 4:

P(0<X1,0<Y1)=F(1,1)F(0,1)F(1,0)+F(0,0)P(0 < X \leqslant 1, 0 < Y \leqslant 1) = F(1, 1) - F(0, 1) - F(1, 0) + F(0, 0)

代入分布函数定义: F(1,1)=(1ea)(1eb)F(1, 1) = (1 - e^{-a})(1 - e^{-b})F(0,1)=0F(0, 1) = 0F(1,0)=0F(1, 0) = 0F(0,0)=0F(0, 0) = 0 因此,P(0<X1,0<Y1)=(1ea)(1eb)P(0 < X \leqslant 1, 0 < Y \leqslant 1) = (1 - e^{-a})(1 - e^{-b})

2. 二维离散型随机变量

如果二维随机变量 (X,Y)(X, Y) 所有可能的取值是有限对或可列无穷多对 (xi,yj)(x_i, y_j),则称 (X,Y)(X, Y) 为二维离散型随机变量。

定义 联合概率分布(Joint Probability Distribution / Joint PMF) 设二维离散型随机变量 (X,Y)(X, Y) 所有可能的取值为 (xi,yj)(x_i, y_j)i,j=1,2,i, j = 1, 2, \dots),称

P(X=xi,Y=yj)=pij,i,j=1,2,P(X = x_i, Y = y_j) = p_{ij}, \quad i, j = 1, 2, \dots

(X,Y)(X, Y) 的联合概率分布(或联合分布律)。

联合分布律通常可以用表格形式列出,称为联合分布表

XYX \setminus Yy1y_1y2y_2\dotsyjy_j\dots
x1x_1p11p_{11}p12p_{12}\dotsp1jp_{1j}\dots
x2x_2p21p_{21}p22p_{22}\dotsp2jp_{2j}\dots
\vdots\vdots\vdots\vdots
xix_ipi1p_{i1}pi2p_{i2}\dotspijp_{ij}\dots
\vdots\vdots\vdots\vdots

联合分布律具有两个性质:

  1. pij0p_{ij} \geqslant 0
  2. ijpij=1\sum_i \sum_j p_{ij} = 1

2.1 离散型例题

例 1:同时掷两枚均匀的骰子,记 XX 为两枚骰子点数之和,YY 为两枚骰子点数之差的绝对值。求 (X,Y)(X, Y) 的联合分布律。

解答

骰子点数 (d1,d2)(d_1, d_2) 共有 6×6=366 \times 6 = 36 种等可能的结果。 X=d1+d2X = d_1 + d_2Y=d1d2Y = |d_1 - d_2|。 可能的取值为 X{2,3,,12}X \in \{2, 3, \dots, 12\}Y{0,1,,5}Y \in \{0, 1, \dots, 5\}。 通过枚举所有组合:

  • Y=0Y=0 时,d1=d2d_1=d_2,组合有 (1,1), (2,2), ..., (6,6)。对应的 XX 分别为 2, 4, 6, 8, 10, 12。每个组合概率为 1/361/36
  • Y=1Y=1 时,d1d2=1|d_1-d_2|=1,组合有 (1,2), (2,1), (2,3), (3,2), ..., (5,6), (6,5),共 10 种。 依此类推可以填满分布表。

3. 二维连续型随机变量

定义 联合概率密度函数(Joint Probability Density Function / Joint PDF) 对于二维随机变量 (X,Y)(X, Y) 的分布函数 F(x,y)F(x, y),如果存在非负函数 f(x,y)f(x, y),使得对于任意实数 x,yx, y 都有:

F(x,y)=xyf(u,v)dvduF(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(u, v) \, \mathrm{d}v \, \mathrm{d}u

则称 (X,Y)(X, Y) 为二维连续型随机变量,函数 f(x,y)f(x, y) 称为它的联合概率密度函数。

3.1 联合 PDF 的性质

  1. f(x,y)0f(x, y) \geqslant 0
  2. ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x \, \mathrm{d}y = 1
  3. DD 是平面上的一个区域,则点 (X,Y)(X, Y) 落在 DD 内的概率为:

    P((X,Y)D)=Df(x,y)dxdyP((X, Y) \in D) = \iint_D f(x, y) \, \mathrm{d}x \, \mathrm{d}y

  4. f(x,y)f(x, y) 的连续点处,有:

    f(x,y)=2F(x,y)xyf(x, y) = \frac{\partial^2 F(x, y)}{\partial x \partial y}

3.2 常见的连续分布

定义 二维均匀分布(Two-dimensional Uniform Distribution) 设 DD 是平面上的一个有界区域,其面积为 SDS_D。如果 (X,Y)(X, Y) 的联合密度函数为:

f(x,y)={1SD,(x,y)D0,其他f(x, y) = \begin{cases} \frac{1}{S_D}, & (x, y) \in D \\ 0, & \text{其他} \end{cases}

则称 (X,Y)(X, Y) 在区域 DD 上服从均匀分布。

定义 二维正态分布(Bivariate Normal Distribution) 如果二维随机变量 (X,Y)(X, Y) 的联合密度函数为:

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}f(x, y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2} - 2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2} + \frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}

其中 μ1,μ2,σ1,σ2,ρ\mu_1, \mu_2, \sigma_1, \sigma_2, \rho 都是常数,且 σ1>0,σ2>0,ρ<1\sigma_1 > 0, \sigma_2 > 0, |\rho| < 1,则称 (X,Y)(X, Y) 服从参数为 μ1,μ2,σ12,σ22,ρ\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho 的二维正态分布,记作 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)

参数含义

  • μ1,μ2\mu_1, \mu_2:分别是 XXYY 的均值。
  • σ12,σ22\sigma_1^2, \sigma_2^2:分别是 XXYY 的方差。
  • ρ\rhoXXYY 的相关系数。

3.3 连续型例题

例 2:设 (X,Y)(X, Y) 的联合密度函数为:

f(x,y)={kxy,0x1,0y10,其他f(x, y) = \begin{cases} kxy, & 0 \leqslant x \leqslant 1, 0 \leqslant y \leqslant 1 \\ 0, & \text{其他} \end{cases}

(1) 确定常数 kk;(2) 计算 P(X+Y1)P(X + Y \leqslant 1)

解答

(1) 利用联合 PDF 的归一性:

0101kxydxdy=k(01xdx)(01ydy)=k1212=k4=1\int_0^1 \int_0^1 kxy \, \mathrm{d}x \, \mathrm{d}y = k \left( \int_0^1 x \, \mathrm{d}x \right) \left( \int_0^1 y \, \mathrm{d}y \right) = k \cdot \frac{1}{2} \cdot \frac{1}{2} = \frac{k}{4} = 1

解得 k=4k = 4

(2) 计算概率:

P(X+Y1)=x+y1,0x,y14xydxdy=01(01x4xydy)dxP(X + Y \leqslant 1) = \iint_{x+y \leqslant 1, 0 \leqslant x, y \leqslant 1} 4xy \, \mathrm{d}x \, \mathrm{d}y = \int_0^1 \left( \int_0^{1-x} 4xy \, \mathrm{d}y \right) \mathrm{d}x

=012x(1x)2dx=01(2x4x2+2x3)dx=[x243x3+12x4]01=143+12=16= \int_0^1 2x(1-x)^2 \, \mathrm{d}x = \int_0^1 (2x - 4x^2 + 2x^3) \, \mathrm{d}x = \left[ x^2 - \frac{4}{3}x^3 + \frac{1}{2}x^4 \right]_0^1 = 1 - \frac{4}{3} + \frac{1}{2} = \frac{1}{6}

4. 边缘分布

联合分布描述了 (X,Y)(X, Y) 的整体分布情况,而其中每一个分量 XXYY 也有自己的分布。

定义 边缘分布函数(Marginal Distribution Function) 二维随机变量 (X,Y)(X, Y) 关于 XX 的边缘分布函数记作 FX(x)F_X(x),定义为:

FX(x)=P(Xx)=P(Xx,Y<+)=F(x,+)F_X(x) = P(X \leqslant x) = P(X \leqslant x, Y < +\infty) = F(x, +\infty)

同理,关于 YY 的边缘分布函数为:

FY(y)=P(Yy)=F(+,y)F_Y(y) = P(Y \leqslant y) = F(+\infty, y)

4.1 离散型的边缘分布

对于离散型随机变量,其边缘分布律可以通过对联合分布律求和得到。 边缘 PMF 分别为:

P(X=xi)=jpij=piP(X = x_i) = \sum_{j} p_{ij} = p_{i\cdot}

P(Y=yj)=ipij=pjP(Y = y_j) = \sum_{i} p_{ij} = p_{\cdot j}

在分布表中,这对应于将各行或各列的概率加总。

4.2 连续型的边缘分布

对于连续型随机变量,通过积分消去不需要的变量: 边缘 PDF 分别为:

fX(x)=+f(x,y)dyf_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}y

fY(y)=+f(x,y)dxf_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x

如果 (X,Y)(X, Y) 在区域 DD 上服从均匀分布,那么 fX(x)f_X(x)xx 轴上的投影区间内可能不再是均匀分布。

二维正态分布的边缘分布: 若 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho),则其边缘分布仍为正态分布:

XN(μ1,σ12),YN(μ2,σ22)X \sim N(\mu_1, \sigma_1^2), \quad Y \sim N(\mu_2, \sigma_2^2)

证明时需要对 f(x,y)f(x, y) 进行配方并对另一个变量在 (,+)(-\infty, +\infty) 积分。

重要结论

  1. 联合分布可以唯一确定边缘分布
  2. 边缘分布通常不能唯一确定联合分布

反例说明: 设 XXYY 都服从标准正态分布 N(0,1)N(0, 1)。 如果 XXYY 独立,其联合密度为 f1(x,y)=ϕ(x)ϕ(y)f_1(x, y) = \phi(x)\phi(y)。 如果我们构造另一个分布,比如在某些对称点上改变密度但不改变投影积和,其边缘分布依然是 N(0,1)N(0, 1),但联合分布已经改变。 这意味着两个分量的个体特征(边缘分布)不足以还原它们之间的相互关系(联合分布)。

4.3 边缘分布例题

例 2:已知 (X,Y)(X, Y) 服从单位圆 D={(x,y)x2+y21}D = \{(x, y) \mid x^2 + y^2 \leqslant 1\} 上的均匀分布,求 fX(x)f_X(x)

解答

由题意,SD=πS_D = \pi,联合密度为:

f(x,y)={1π,x2+y210,其他f(x, y) = \begin{cases} \frac{1}{\pi}, & x^2 + y^2 \leqslant 1 \\ 0, & \text{其他} \end{cases}

fX(x)f_X(x),对 yy 积分。固定 x(1,1)x \in (-1, 1)yy 的范围是 1x2y1x2-\sqrt{1-x^2} \leqslant y \leqslant \sqrt{1-x^2}

fX(x)=1x21x21πdy=21x2π,x1f_X(x) = \int_{-\sqrt{1-x^2}}^{\sqrt{1-x^2}} \frac{1}{\pi} \, \mathrm{d}y = \frac{2\sqrt{1-x^2}}{\pi}, \quad |x| \leqslant 1

x>1|x| > 1 时,fX(x)=0f_X(x) = 0

4.4 连续型边缘分布例题

例 4:已知 (X,Y)(X, Y) 的联合密度函数为:

f(x,y)={2ex2y,x>0,y>00,其他f(x, y) = \begin{cases} 2e^{-x-2y}, & x > 0, y > 0 \\ 0, & \text{其他} \end{cases}

(1) 求边缘密度 fX(x)f_X(x)fY(y)f_Y(y);(2) 判断 XXYY 是否独立。

解答

(1) 边缘密度:

fX(x)=0+2ex2ydy=2ex(0+e2ydy)=2ex12=ex,x>0f_X(x) = \int_0^{+\infty} 2e^{-x-2y} \, \mathrm{d}y = 2e^{-x} \left( \int_0^{+\infty} e^{-2y} \, \mathrm{d}y \right) = 2e^{-x} \cdot \frac{1}{2} = e^{-x}, \quad x > 0

fY(y)=0+2ex2ydx=2e2y(0+exdx)=2e2y1=2e2y,y>0f_Y(y) = \int_0^{+\infty} 2e^{-x-2y} \, \mathrm{d}x = 2e^{-2y} \left( \int_0^{+\infty} e^{-x} \, \mathrm{d}x \right) = 2e^{-2y} \cdot 1 = 2e^{-2y}, \quad y > 0

(2) 判断独立性:

fX(x)fY(y)=ex2e2y=2ex2y=f(x,y)f_X(x)f_Y(y) = e^{-x} \cdot 2e^{-2y} = 2e^{-x-2y} = f(x, y)

因此,XXYY 相互独立。

5. 条件分布

定义 条件分布(Conditional Distribution) 在已知其中一个随机变量取值的条件下,另一个随机变量的概率分布称为条件分布。

5.1 离散型条件分布

(X,Y)(X, Y) 是离散型随机变量,对于固定的 jj,若 P(Y=yj)>0P(Y = y_j) > 0,则在 Y=yjY = y_j 的条件下,XX 的条件分布律为:

P(X=xiY=yj)=P(X=xi,Y=yj)P(Y=yj)=pijpjP(X = x_i \mid Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)} = \frac{p_{ij}}{p_{\cdot j}}

5.2 连续型条件分布

对于连续型随机变量,不能直接使用 P(Y=y)P(Y=y) 因为该概率为 0。我们利用极限过程定义。

定义 条件概率密度函数(Conditional PDF) 设 (X,Y)(X, Y) 的联合密度函数为 f(x,y)f(x, y),边缘密度函数为 fY(y)f_Y(y)。在 fY(y)>0f_Y(y) > 0 的点 yy,称

fXY(xy)=f(x,y)fY(y)f_{X|Y}(x \mid y) = \frac{f(x, y)}{f_Y(y)}

为在 Y=yY = y 的条件下 XX 的条件概率密度函数。

同理,可定义 fYX(yx)f_{Y|X}(y \mid x)

例 3:求二维正态分布的条件分布。 可以证明,若 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho),则 fXY(xy)f_{X|Y}(x \mid y) 仍然是一个一维正态分布。其均值和方差分别是 yy 的线性函数。

5.3 连续型条件分布例题

例 5:设 (X,Y)(X, Y) 在区域 D={(x,y)0<x<1,0<y<x}D = \{(x, y) \mid 0 < x < 1, 0 < y < x\} 上服从均匀分布。求在 X=xX = x 的条件下 YY 的条件概率密度。

解答

由题意,DD 的面积 SD=12S_D = \frac{1}{2},联合密度为:

f(x,y)={2,0<x<1,0<y<x0,其他f(x, y) = \begin{cases} 2, & 0 < x < 1, 0 < y < x \\ 0, & \text{其他} \end{cases}

(1) 求边缘密度 fX(x)f_X(x)

fX(x)=0x2dy=2x,0<x<1f_X(x) = \int_0^x 2 \, \mathrm{d}y = 2x, \quad 0 < x < 1

(2) 求条件密度 fYX(yx)f_{Y|X}(y \mid x)

fYX(yx)=f(x,y)fX(x)=22x=1x,0<y<xf_{Y|X}(y \mid x) = \frac{f(x, y)}{f_X(x)} = \frac{2}{2x} = \frac{1}{x}, \quad 0 < y < x

0<x<10 < x < 1 时,fYX(yx)U(0,x)f_{Y|X}(y \mid x) \sim U(0, x)

6. 随机变量的独立性

定义 随机变量的独立性(Independence of Random Variables) 设 F(x,y)F(x, y) 是二维随机变量 (X,Y)(X, Y) 的联合分布函数,FX(x),FY(y)F_X(x), F_Y(y) 分别是其边缘分布函数。如果对于任意实数 x,yx, y,都有:

F(x,y)=FX(x)FY(y)F(x, y) = F_X(x) F_Y(y)

则称随机变量 XXYY 是相互独立的。

6.1 独立性的等价条件

  1. 离散型XXYY 独立当且仅当对所有的 i,ji, j,有:

    pij=pipjp_{ij} = p_{i\cdot} \cdot p_{\cdot j}

  2. 连续型XXYY 独立当且仅当在平面上几乎处处成立:

    f(x,y)=fX(x)fY(y)f(x, y) = f_X(x) f_Y(y)

6.2 正态分布的独立性

对于二维正态分布 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)XXYY 相互独立的充要条件是 ρ=0\rho = 0。 这意味着对于二维正态分布,不相关(ρ=0\rho=0)与独立是等价的。注意,这在一般分布中并不成立。

6.3 独立性例题

例 6:设 X,YX, Y 的联合概率分布如下:

XYX \setminus Y0011
001/61/61/31/3
111/31/31/61/6

(1) 求边缘分布;(2) 判断 XXYY 是否独立。

解答

(1) 边缘分布: P(X=0)=1/6+1/3=1/2P(X=0) = 1/6 + 1/3 = 1/2P(X=1)=1/3+1/6=1/2P(X=1) = 1/3 + 1/6 = 1/2P(Y=0)=1/6+1/3=1/2P(Y=0) = 1/6 + 1/3 = 1/2P(Y=1)=1/3+1/6=1/2P(Y=1) = 1/3 + 1/6 = 1/2

(2) 判断独立性: P(X=0,Y=0)=1/6P(X=0, Y=0) = 1/6P(X=0)P(Y=0)=1/21/2=1/4P(X=0)P(Y=0) = 1/2 \cdot 1/2 = 1/4 由于 P(X=0,Y=0)P(X=0)P(Y=0)P(X=0, Y=0) \neq P(X=0)P(Y=0),因此 XXYY 不独立。

7. 两个随机变量函数的分布

已知 (X,Y)(X, Y) 的联合分布,求 Z=g(X,Y)Z = g(X, Y) 的分布。

7.1 和的分布与卷积公式

(X,Y)(X, Y) 是连续型随机变量,其密度函数为 f(x,y)f(x, y)。设 Z=X+YZ = X + Y,则 ZZ 的分布函数为:

FZ(z)=P(X+Yz)=x+yzf(x,y)dxdyF_Z(z) = P(X + Y \leqslant z) = \iint_{x+y \leqslant z} f(x, y) \, \mathrm{d}x \, \mathrm{d}y

为了求 fZ(z)f_Z(z),我们先固定 xx,对 yy 进行积分,此时 yy 的上限为 zxz - x

FZ(z)=+[zxf(x,y)dy]dxF_Z(z) = \int_{-\infty}^{+\infty} \left[ \int_{-\infty}^{z-x} f(x, y) \, \mathrm{d}y \right] \mathrm{d}x

zz 求导(利用变上限积分求导法则):

fZ(z)=ddz+[zxf(x,y)dy]dx=+[zzxf(x,y)dy]dxf_Z(z) = \frac{\mathrm{d}}{\mathrm{d}z} \int_{-\infty}^{+\infty} \left[ \int_{-\infty}^{z-x} f(x, y) \, \mathrm{d}y \right] \mathrm{d}x = \int_{-\infty}^{+\infty} \left[ \frac{\partial}{\partial z} \int_{-\infty}^{z-x} f(x, y) \, \mathrm{d}y \right] \mathrm{d}x

从而得到卷积公式

fZ(z)=+f(x,zx)dxf_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x) \, \mathrm{d}x

如果 XXYY 独立,则有 f(x,y)=fX(x)fY(y)f(x, y) = f_X(x) f_Y(y),代入上式得:

fZ(z)=+fX(x)fY(zx)dxf_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x) \, \mathrm{d}x

由于 XXYY 的对称性,上式也可以写作:

fZ(z)=+fY(y)fX(zy)dyf_Z(z) = \int_{-\infty}^{+\infty} f_Y(y) f_X(z-y) \, \mathrm{d}y

7.2 比值的分布(补)

X,YX, Y 独立,且 Y>0Y > 0,求 Z=X/YZ = X/Y 的分布。

FZ(z)=P(X/Yz)=P(XzY)=0+[zyfX(x)fY(y)dx]dyF_Z(z) = P(X/Y \leqslant z) = P(X \leqslant zY) = \int_0^{+\infty} \left[ \int_{-\infty}^{zy} f_X(x) f_Y(y) \, \mathrm{d}x \right] \mathrm{d}y

求导得:

fZ(z)=0+yfX(zy)fY(y)dyf_Z(z) = \int_0^{+\infty} y f_X(zy) f_Y(y) \, \mathrm{d}y

7.3 最大值与最小值的分布

X,YX, Y 相互独立,分布函数分别为 FX(x),FY(y)F_X(x), F_Y(y)

  • 最大值 M=max(X,Y)M = \max(X, Y) 的分布函数:

    FM(z)=P(max(X,Y)z)=P(Xz,Yz)=FX(z)FY(z)F_M(z) = P(\max(X, Y) \leqslant z) = P(X \leqslant z, Y \leqslant z) = F_X(z) F_Y(z)

  • 最小值 N=min(X,Y)N = \min(X, Y) 的分布函数:

    FN(z)=P(min(X,Y)z)=1P(min(X,Y)>z)=1P(X>z,Y>z)=1[1FX(z)][1FY(z)]F_N(z) = P(\min(X, Y) \leqslant z) = 1 - P(\min(X, Y) > z) = 1 - P(X > z, Y > z) = 1 - [1 - F_X(z)][1 - F_Y(z)]

例 4:在一个串联系统中,只要有一个部件失效系统就失效。设各部件寿命 XiX_i 独立且服从指数分布,则系统寿命 N=min(X1,,Xk)N = \min(X_1, \dots, X_k) 依然服从指数分布,且参数为各部件参数之和。

7.4 函数分布例题

例 7:设 XE(1),YE(1)X \sim E(1), Y \sim E(1) 且相互独立(指数分布),求 Z=X+YZ = X + Y 的分布。

解答

由题意,fX(x)=ex,x>0f_X(x) = e^{-x}, x > 0fY(y)=ey,y>0f_Y(y) = e^{-y}, y > 0。 利用卷积公式:

fZ(z)=0zfX(x)fY(zx)dx=0zexe(zx)dxf_Z(z) = \int_0^z f_X(x) f_Y(z-x) \, \mathrm{d}x = \int_0^z e^{-x} e^{-(z-x)} \, \mathrm{d}x

=0zezdx=zez,z>0= \int_0^z e^{-z} \, \mathrm{d}x = z e^{-z}, \quad z > 0

这说明独立指数分布之和服从 Erlang 分布。

例 8:在串联系统与并联系统中,设两个部件的寿命 X,YX, Y 独立且都服从参数为 λ\lambda 的指数分布。 (1) 系统串联时的寿命 N=min(X,Y)N = \min(X, Y); (2) 系统并联时的寿命 M=max(X,Y)M = \max(X, Y)

解答

(1) 串联系统:

FN(z)=1[1FX(z)][1FY(z)]=1eλzeλz=1e2λz,z>0F_N(z) = 1 - [1 - F_X(z)][1 - F_Y(z)] = 1 - e^{-\lambda z} e^{-\lambda z} = 1 - e^{-2\lambda z}, \quad z > 0

寿命服从参数为 2λ2\lambda 的指数分布。

(2) 并联系统:

FM(z)=FX(z)FY(z)=(1eλz)2,z>0F_M(z) = F_X(z) F_Y(z) = (1 - e^{-\lambda z})^2, \quad z > 0

寿命分布为 FM(z)=12eλz+e2λzF_M(z) = 1 - 2e^{-\lambda z} + e^{-2\lambda z}

参考文献

  1. 《概率论与数理统计》 盛骤等编,第五版
  2. 概率论基础教程,Sheldon Ross 著