Skip to content

区间估计

在上一章中,我们讨论了点估计,即用一个具体的数值作为参数的估计值。点估计虽然直观,但它存在一个显著的局限:我们无法得知这个估计值与参数真实值之间的接近程度。即便点估计量具有优良的性质(如无偏性),在特定的随机样本下,估计值与真实值之间仍可能存在不可忽视的偏差。为了衡量估计的精确度和可靠性,我们需要引入区间估计。区间估计不仅提供一个估计范围,还给出该范围包含参数真实值的概率保证,从而为决策提供更完备的信息。

1. 区间估计的基本概念

区间估计的任务是根据样本数据,构造出两个统计量 θ^L\hat{\theta}_Lθ^U\hat{\theta}_U,形成一个随机区间 [θ^L,θ^U][\hat{\theta}_L, \hat{\theta}_U],使得该区间以预先给定的概率包含未知参数 θ\theta

定义 置信区间 (Confidence Interval)θ\theta 是总体的一个待估参数,对于给定的 α\alpha (0<α<10 < \alpha < 1),如果由样本确定的两个统计量 θ^L=θ^L(X1,,Xn)\hat{\theta}_L = \hat{\theta}_L(X_1, \dots, X_n)θ^U=θ^U(X1,,Xn)\hat{\theta}_U = \hat{\theta}_U(X_1, \dots, X_n) 满足 P(θ^Lθθ^U)=1αP(\hat{\theta}_L \leqslant \theta \leqslant \hat{\theta}_U) = 1 - \alpha,则称随机区间 [θ^L,θ^U][\hat{\theta}_L, \hat{\theta}_U]θ\theta 的置信水平为 1α1 - \alpha 的置信区间。

定义 置信水平 (Confidence Level) 置信水平即概率 1α1 - \alpha,它表示了区间估计的可靠程度。在实际应用中,常见的置信水平取值为 0.95 或 0.99。

定义 置信上限与置信下限 (Confidence Limits) 在置信区间 [θ^L,θ^U][\hat{\theta}_L, \hat{\theta}_U] 中,θ^L\hat{\theta}_L 称为置信下限 (Lower Confidence Limit),θ^U\hat{\theta}_U 称为置信上限 (Upper Confidence Limit)。

对于置信区间的理解需要特别注意其频率学派的解释。当一个具体的样本被观测到并计算出区间 [a,b][a, b] 后,参数 θ\theta 落在该区间内的概率要么是 1,要么是 0,因为 θ\theta 是一个固定的常数。置信水平 1α1 - \alpha 的含义是:如果我们重复进行多次抽样并构造区间,大约有 100(1α)%100(1-\alpha)\% 的区间会包含真实参数。

区间估计涉及两个核心指标:可靠度(即置信水平 1α1-\alpha)与精确度(即区间长度 θ^Uθ^L\hat{\theta}_U - \hat{\theta}_L)。在样本量固定的情况下,这两者是矛盾的。提高可靠度通常会增加区间长度,从而降低精确度。优秀的估计应在保证足够可靠度的前提下,尽可能提高精确度。

2. 枢轴量法

构造置信区间最通用的方法是枢轴量法。其核心思想是构造一个包含待估参数和样本,但其分布不依赖于任何未知参数的随机变量。

定义 枢轴量 (Pivotal Quantity) 设样本 X1,,XnX_1, \dots, X_n 来自含有待估参数 θ\theta 的总体。如果随机变量 Q(X1,,Xn;θ)Q(X_1, \dots, X_n; \theta) 的分布是已知的,且不依赖于 θ\theta 及其他未知参数,则称 QQ 为参数 θ\theta 的枢轴量。

利用枢轴量构造置信区间的步骤如下:

  1. 确定一个合适的统计量(如极大似然估计量),并由此构造枢轴量 Q(X1,,Xn;θ)Q(X_1, \dots, X_n; \theta)
  2. 确定枢轴量 QQ 的分布(如正态分布、t 分布等)。
  3. 对于给定的置信水平 1α1 - \alpha,寻找常数 a,ba, b,使得 P(aQb)=1αP(a \leqslant Q \leqslant b) = 1 - \alpha
  4. 通过代数变形,将不等式 aQba \leqslant Q \leqslant b 转化为 θ^Lθθ^U\hat{\theta}_L \leqslant \theta \leqslant \hat{\theta}_U 的形式。

3. 正态总体均值的置信区间

设样本 X1,,XnX_1, \dots, X_n 来自正态总体 N(μ,σ2)N(\mu, \sigma^2),我们需要估计均值 μ\mu

3.1 σ2\sigma^2 已知(z 区间)

当总体方差 σ2\sigma^2 已知时,由于样本均值 XˉN(μ,σ2/n)\bar{X} \sim N(\mu, \sigma^2/n),我们可以构造如下枢轴量。

枢轴量构造与推导

Z=Xˉμσ/nZ = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}}。 由正态分布性质可知,ZN(0,1)Z \sim N(0, 1)。 给定 α\alpha,根据标准正态分布的对称性,选取分位数 zα/2z_{\alpha/2} 使得:

P(zα/2Xˉμσ/nzα/2)=1αP\left( -z_{\alpha/2} \leqslant \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \leqslant z_{\alpha/2} \right) = 1 - \alpha

解不等式:

zα/2σnXˉμzα/2σn-z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leqslant \bar{X} - \mu \leqslant z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Xˉzα/2σnμXˉ+zα/2σn\bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \leqslant \mu \leqslant \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}}

因此,μ\mu 的置信区间为:

[Xˉzα/2σn,Xˉ+zα/2σn]\left[ \bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}}, \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right]

例题 3.1 某机器包装出的食盐重量服从正态分布 N(μ,0.012)N(\mu, 0.01^2)(单位:kg)。随机抽取 9 袋,测得平均重量为 0.502 kg。求 μ\mu 的 95% 置信区间。 解:已知 n=9,xˉ=0.502,σ=0.01n=9, \bar{x}=0.502, \sigma=0.01。对于 α=0.05\alpha=0.05z0.025=1.96z_{0.025} = 1.96。 误差限为 1.960.0190.00651.96 \cdot \frac{0.01}{\sqrt{9}} \approx 0.0065。 置信区间为 [0.5020.0065,0.502+0.0065]=[0.4955,0.5085][0.502 - 0.0065, 0.502 + 0.0065] = [0.4955, 0.5085]

3.2 σ2\sigma^2 未知(t 区间)

在实际中,σ2\sigma^2 往往是未知的。此时我们用样本标准差 SS 代替 σ\sigma

枢轴量推导

根据 抽样分布 中的结论,构造枢轴量:

T=XˉμS/nt(n1)T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

选取分位数 tα/2(n1)t_{\alpha/2}(n-1) 使得 P(Ttα/2(n1))=1αP(|T| \leqslant t_{\alpha/2}(n-1)) = 1 - \alpha。 解出 μ\mu 的区间为:

[Xˉtα/2(n1)Sn,Xˉ+tα/2(n1)Sn]\left[ \bar{X} - t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}}, \bar{X} + t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right]

当样本量 nn 较大时(通常 n>30n > 30),根据大数定律和中心极限定理,tt 分布近似于标准正态分布,t 区间可以用 z 区间近似。

例题 3.2 测量某种金属的抗拉强度(单位:MPa),得到 5 个数据:398, 412, 405, 390, 415。假设强度服从正态分布,求均值的 95% 置信区间。 解:计算得 xˉ=404,s=10.37,n=5,df=4\bar{x} = 404, s = 10.37, n=5, df=4。 查表得 t0.025(4)=2.776t_{0.025}(4) = 2.776。 区间半径为 2.77610.37512.872.776 \cdot \frac{10.37}{\sqrt{5}} \approx 12.87。 置信区间为 [391.13,416.87][391.13, 416.87]

4. 正态总体方差的置信区间

估计正态总体的方差 σ2\sigma^2 时,我们利用样本方差 S2S^2 构造枢轴量。

枢轴量推导

已知 (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)。 对于给定的 α\alpha,选取分位数使得:

P(χ1α/22(n1)(n1)S2σ2χα/22(n1))=1αP\left( \chi^2_{1-\alpha/2}(n-1) \leqslant \frac{(n-1)S^2}{\sigma^2} \leqslant \chi^2_{\alpha/2}(n-1) \right) = 1 - \alpha

解得 σ2\sigma^2 的置信区间为:

[(n1)S2χα/22(n1),(n1)S2χ1α/22(n1)]\left[ \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \right]

需要注意,卡方分布 是非对称的,因此置信限的分位数需要分别查表确定。

例题 4.1 在例题 3.2 中,求抗拉强度方差 σ2\sigma^2 的 95% 置信区间。 解:n1=4,s2=107.5n-1=4, s^2 = 107.5。 查表 χ0.0252(4)=11.143,χ0.9752(4)=0.484\chi^2_{0.025}(4) = 11.143, \chi^2_{0.975}(4) = 0.484。 下限:4107.511.14338.59\frac{4 \cdot 107.5}{11.143} \approx 38.59。 上限:4107.50.484888.43\frac{4 \cdot 107.5}{0.484} \approx 888.43。 区间为 [38.59,888.43][38.59, 888.43]

5. 两个正态总体的置信区间

考虑两个独立样本 XN(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)

5.1 均值差 μ1μ2\mu_1 - \mu_2 的置信区间

  1. 方差 σ12,σ22\sigma_1^2, \sigma_2^2 已知: 枢轴量 Z=(XˉYˉ)(μ1μ2)σ12/n1+σ22/n2N(0,1)Z = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}} \sim N(0, 1)。 区间为:(XˉYˉ)±zα/2σ12n1+σ22n2(\bar{X} - \bar{Y}) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}

  2. 方差未知但相等 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2: 此时需要计算合并样本方差。

定义 合并样本方差 (Pooled Sample Variance) 设两个独立样本的方差分别为 S12S_1^2S22S_2^2,样本量为 n1n_1n2n_2,则合并样本方差定义为:

Sp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}

枢轴量 T=(XˉYˉ)(μ1μ2)Sp1/n1+1/n2t(n1+n22)T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{1/n_1 + 1/n_2}} \sim t(n_1+n_2-2)

  1. 方差未知且不等: 使用 Welch 近似。自由度计算较复杂,通常借助软件完成。

5.2 方差比 σ12/σ22\sigma_1^2/\sigma_2^2 的置信区间

利用 F 分布 构造枢轴量:

F=S12/σ12S22/σ22F(n11,n21)F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)

置信区间为:

[S12/S22Fα/2(n11,n21),S12/S22F1α/2(n11,n21)]\left[ \frac{S_1^2/S_2^2}{F_{\alpha/2}(n_1-1, n_2-1)}, \frac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1-1, n_2-1)} \right]

6. 单侧置信限

在某些场景下(如设备寿命、有害物质含量),我们只关心参数的一个边界。

定义 单侧置信下限 (One-sided Lower Confidence Limit) 满足 P(θ^Lθ)=1αP(\hat{\theta}_L \leqslant \theta) = 1 - \alpha 的统计量 θ^L\hat{\theta}_L。例如,我们希望保证灯泡寿命至少为多少小时。

定义 单侧置信上限 (One-sided Upper Confidence Limit) 满足 P(θθ^U)=1αP(\theta \leqslant \hat{\theta}_U) = 1 - \alpha 的统计量 θ^U\hat{\theta}_U。例如,控制废气排放量的上限。

单侧估计与双侧的区别在于,显著性水平 α\alpha 全部放在分布的一侧。以 σ2\sigma^2 已知下的均值估计为例,单侧下限为 Xˉzασn\bar{X} - z_{\alpha} \frac{\sigma}{\sqrt{n}}

7. 样本量的确定

设计实验时,我们常问:为了达到某种精度,需要多少样本?

设要求的误差限(区间半径)为 δ\delta。在 σ2\sigma^2 已知下:

zα/2σnδ    nzα/2σδz_{\alpha/2} \frac{\sigma}{\sqrt{n}} \leqslant \delta \implies \sqrt{n} \geqslant \frac{z_{\alpha/2} \cdot \sigma}{\delta}

定义 最小样本量 (Minimum Sample Size) 给定置信水平 1α1-\alpha 和允许误差 δ\delta,估计正态均值所需的最小样本量公式为:

n(zα/2σδ)2n \geqslant \left( \frac{z_{\alpha/2} \cdot \sigma}{\delta} \right)^2

例题 7.1 欲估计某批零件的平均直径,已知直径分布的 σ=0.5\sigma=0.5 mm。要求在 95% 置信水平下,误差不超过 0.1 mm,问至少应抽取多少个零件? 解:α=0.05,z0.025=1.96,σ=0.5,δ=0.1\alpha=0.05, z_{0.025}=1.96, \sigma=0.5, \delta=0.1n(1.960.50.1)2=(9.8)2=96.04n \geqslant \left( \frac{1.96 \cdot 0.5}{0.1} \right)^2 = (9.8)^2 = 96.04。 故至少应抽取 97 个零件。

参考文献

  1. 陈希孺. 概率论与数理统计 [M]. 中国科学技术大学出版社, 2009.
  2. 盛骤, 谢式千, 潘承毅. 概率论与数理统计 [M]. 高等教育出版社, 2008.
  3. Casella, G., & Berger, R. L. Statistical Inference [M]. Cengage Learning, 2002.