区间估计

在上一章中，我们讨论了点估计，即用一个具体的数值作为参数的估计值。点估计虽然直观，但它存在一个显著的局限：我们无法得知这个估计值与参数真实值之间的接近程度。即便点估计量具有优良的性质（如无偏性），在特定的随机样本下，估计值与真实值之间仍可能存在不可忽视的偏差。为了衡量估计的精确度和可靠性，我们需要引入区间估计。区间估计不仅提供一个估计范围，还给出该范围包含参数真实值的概率保证，从而为决策提供更完备的信息。

1. 区间估计的基本概念

区间估计的任务是根据样本数据，构造出两个统计量 $\hat{\theta}_L$ 和 $\hat{\theta}_U$ ，形成一个随机区间 $[\hat{\theta}_L, \hat{\theta}_U]$ ，使得该区间以预先给定的概率包含未知参数 $\theta$ 。

定义 置信区间 (Confidence Interval) 设 $\theta$ 是总体的一个待估参数，对于给定的 $\alpha$ ( $0 < \alpha < 1$ )，如果由样本确定的两个统计量 $\hat{\theta}_L = \hat{\theta}_L(X_1, \dots, X_n)$ 和 $\hat{\theta}_U = \hat{\theta}_U(X_1, \dots, X_n)$ 满足 $P(\hat{\theta}_L \leqslant \theta \leqslant \hat{\theta}_U) = 1 - \alpha$ ，则称随机区间 $[\hat{\theta}_L, \hat{\theta}_U]$ 为 $\theta$ 的置信水平为 $1 - \alpha$ 的置信区间。

定义 置信水平 (Confidence Level) 置信水平即概率 $1 - \alpha$ ，它表示了区间估计的可靠程度。在实际应用中，常见的置信水平取值为 0.95 或 0.99。

定义 置信上限与置信下限 (Confidence Limits) 在置信区间 $[\hat{\theta}_L, \hat{\theta}_U]$ 中， $\hat{\theta}_L$ 称为置信下限 (Lower Confidence Limit)， $\hat{\theta}_U$ 称为置信上限 (Upper Confidence Limit)。

对于置信区间的理解需要特别注意其频率学派的解释。当一个具体的样本被观测到并计算出区间 $[a, b]$ 后，参数 $\theta$ 落在该区间内的概率要么是 1，要么是 0，因为 $\theta$ 是一个固定的常数。置信水平 $1 - \alpha$ 的含义是：如果我们重复进行多次抽样并构造区间，大约有 $100(1-\alpha)\%$ 的区间会包含真实参数。

区间估计涉及两个核心指标：可靠度（即置信水平 $1-\alpha$ ）与精确度（即区间长度 $\hat{\theta}_U - \hat{\theta}_L$ ）。在样本量固定的情况下，这两者是矛盾的。提高可靠度通常会增加区间长度，从而降低精确度。优秀的估计应在保证足够可靠度的前提下，尽可能提高精确度。

2. 枢轴量法

构造置信区间最通用的方法是枢轴量法。其核心思想是构造一个包含待估参数和样本，但其分布不依赖于任何未知参数的随机变量。

定义 枢轴量 (Pivotal Quantity) 设样本 $X_1, \dots, X_n$ 来自含有待估参数 $\theta$ 的总体。如果随机变量 $Q(X_1, \dots, X_n; \theta)$ 的分布是已知的，且不依赖于 $\theta$ 及其他未知参数，则称 $Q$ 为参数 $\theta$ 的枢轴量。

利用枢轴量构造置信区间的步骤如下：

确定一个合适的统计量（如极大似然估计量），并由此构造枢轴量 $Q(X_1, \dots, X_n; \theta)$ 。
确定枢轴量 $Q$ 的分布（如正态分布、t 分布等）。
对于给定的置信水平 $1 - \alpha$ ，寻找常数 $a, b$ ，使得 $P(a \leqslant Q \leqslant b) = 1 - \alpha$ 。
通过代数变形，将不等式 $a \leqslant Q \leqslant b$ 转化为 $\hat{\theta}_L \leqslant \theta \leqslant \hat{\theta}_U$ 的形式。

3. 正态总体均值的置信区间

设样本 $X_1, \dots, X_n$ 来自正态总体 $N(\mu, \sigma^2)$ ，我们需要估计均值 $\mu$ 。

3.1 $\sigma^2$ 已知（z 区间）

当总体方差 $\sigma^2$ 已知时，由于样本均值 $\bar{X} \sim N(\mu, \sigma^2/n)$ ，我们可以构造如下枢轴量。

枢轴量构造与推导

令 $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}}$ 。由正态分布性质可知， $Z \sim N(0, 1)$ 。给定 $\alpha$ ，根据标准正态分布的对称性，选取分位数 $z_{\alpha/2}$ 使得：

P\left( -z_{\alpha/2} \leqslant \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \leqslant z_{\alpha/2} \right) = 1 - \alpha

解不等式：

-z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \leqslant \bar{X} - \mu \leqslant z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

\bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \leqslant \mu \leqslant \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}}

因此， $\mu$ 的置信区间为：

\left[ \bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}}, \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right]

例题 3.1 某机器包装出的食盐重量服从正态分布 $N(\mu, 0.01^2)$ （单位：kg）。随机抽取 9 袋，测得平均重量为 0.502 kg。求 $\mu$ 的 95% 置信区间。解：已知 $n=9, \bar{x}=0.502, \sigma=0.01$ 。对于 $\alpha=0.05$ ， $z_{0.025} = 1.96$ 。误差限为 $1.96 \cdot \frac{0.01}{\sqrt{9}} \approx 0.0065$ 。置信区间为 $[0.502 - 0.0065, 0.502 + 0.0065] = [0.4955, 0.5085]$ 。

3.2 $\sigma^2$ 未知（t 区间）

在实际中， $\sigma^2$ 往往是未知的。此时我们用样本标准差 $S$ 代替 $\sigma$ 。

枢轴量推导

根据抽样分布中的结论，构造枢轴量：

T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

选取分位数 $t_{\alpha/2}(n-1)$ 使得 $P(|T| \leqslant t_{\alpha/2}(n-1)) = 1 - \alpha$ 。解出 $\mu$ 的区间为：

\left[ \bar{X} - t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}}, \bar{X} + t_{\alpha/2}(n-1) \frac{S}{\sqrt{n}} \right]

当样本量 $n$ 较大时（通常 $n > 30$ ），根据大数定律和中心极限定理， $t$ 分布近似于标准正态分布，t 区间可以用 z 区间近似。

例题 3.2 测量某种金属的抗拉强度（单位：MPa），得到 5 个数据：398, 412, 405, 390, 415。假设强度服从正态分布，求均值的 95% 置信区间。解：计算得 $\bar{x} = 404, s = 10.37, n=5, df=4$ 。查表得 $t_{0.025}(4) = 2.776$ 。区间半径为 $2.776 \cdot \frac{10.37}{\sqrt{5}} \approx 12.87$ 。置信区间为 $[391.13, 416.87]$ 。

4. 正态总体方差的置信区间

估计正态总体的方差 $\sigma^2$ 时，我们利用样本方差 $S^2$ 构造枢轴量。

枢轴量推导

已知 $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ 。对于给定的 $\alpha$ ，选取分位数使得：

P\left( \chi^2_{1-\alpha/2}(n-1) \leqslant \frac{(n-1)S^2}{\sigma^2} \leqslant \chi^2_{\alpha/2}(n-1) \right) = 1 - \alpha

解得 $\sigma^2$ 的置信区间为：

\left[ \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)}, \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \right]

需要注意，卡方分布是非对称的，因此置信限的分位数需要分别查表确定。

例题 4.1 在例题 3.2 中，求抗拉强度方差 $\sigma^2$ 的 95% 置信区间。解： $n-1=4, s^2 = 107.5$ 。查表 $\chi^2_{0.025}(4) = 11.143, \chi^2_{0.975}(4) = 0.484$ 。下限： $\frac{4 \cdot 107.5}{11.143} \approx 38.59$ 。上限： $\frac{4 \cdot 107.5}{0.484} \approx 888.43$ 。区间为 $[38.59, 888.43]$ 。

5. 两个正态总体的置信区间

考虑两个独立样本 $X \sim N(\mu_1, \sigma_1^2)$ 和 $Y \sim N(\mu_2, \sigma_2^2)$ 。

5.1 均值差 $\mu_1 - \mu_2$ 的置信区间

方差 $\sigma_1^2, \sigma_2^2$ 已知：枢轴量 $Z = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}} \sim N(0, 1)$ 。区间为： $(\bar{X} - \bar{Y}) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}$ 。
方差未知但相等 $\sigma_1^2 = \sigma_2^2 = \sigma^2$ ：此时需要计算合并样本方差。

定义 合并样本方差 (Pooled Sample Variance) 设两个独立样本的方差分别为 $S_1^2$ 和 $S_2^2$ ，样本量为 $n_1$ 和 $n_2$ ，则合并样本方差定义为：

S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}

枢轴量 $T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_p \sqrt{1/n_1 + 1/n_2}} \sim t(n_1+n_2-2)$ 。

方差未知且不等：使用 Welch 近似。自由度计算较复杂，通常借助软件完成。

5.2 方差比 $\sigma_1^2/\sigma_2^2$ 的置信区间

利用 F 分布构造枢轴量：

F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)

置信区间为：

\left[ \frac{S_1^2/S_2^2}{F_{\alpha/2}(n_1-1, n_2-1)}, \frac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1-1, n_2-1)} \right]

6. 单侧置信限

在某些场景下（如设备寿命、有害物质含量），我们只关心参数的一个边界。

定义 单侧置信下限 (One-sided Lower Confidence Limit) 满足 $P(\hat{\theta}_L \leqslant \theta) = 1 - \alpha$ 的统计量 $\hat{\theta}_L$ 。例如，我们希望保证灯泡寿命至少为多少小时。

定义 单侧置信上限 (One-sided Upper Confidence Limit) 满足 $P(\theta \leqslant \hat{\theta}_U) = 1 - \alpha$ 的统计量 $\hat{\theta}_U$ 。例如，控制废气排放量的上限。

单侧估计与双侧的区别在于，显著性水平 $\alpha$ 全部放在分布的一侧。以 $\sigma^2$ 已知下的均值估计为例，单侧下限为 $\bar{X} - z_{\alpha} \frac{\sigma}{\sqrt{n}}$ 。

7. 样本量的确定

设计实验时，我们常问：为了达到某种精度，需要多少样本？

设要求的误差限（区间半径）为 $\delta$ 。在 $\sigma^2$ 已知下：

z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \leqslant \delta \implies \sqrt{n} \geqslant \frac{z_{\alpha/2} \cdot \sigma}{\delta}

定义 最小样本量 (Minimum Sample Size) 给定置信水平 $1-\alpha$ 和允许误差 $\delta$ ，估计正态均值所需的最小样本量公式为：

n \geqslant \left( \frac{z_{\alpha/2} \cdot \sigma}{\delta} \right)^2

例题 7.1 欲估计某批零件的平均直径，已知直径分布的 $\sigma=0.5$ mm。要求在 95% 置信水平下，误差不超过 0.1 mm，问至少应抽取多少个零件？解： $\alpha=0.05, z_{0.025}=1.96, \sigma=0.5, \delta=0.1$ 。 $n \geqslant \left( \frac{1.96 \cdot 0.5}{0.1} \right)^2 = (9.8)^2 = 96.04$ 。故至少应抽取 97 个零件。

参考文献

陈希孺. 概率论与数理统计 [M]. 中国科学技术大学出版社, 2009.
盛骤, 谢式千, 潘承毅. 概率论与数理统计 [M]. 高等教育出版社, 2008.
Casella, G., & Berger, R. L. Statistical Inference [M]. Cengage Learning, 2002.

组合数学

不等式

线性代数

数列

数论

概率论

集合论

统计学

三角学

区间估计

1. 区间估计的基本概念

2. 枢轴量法

3. 正态总体均值的置信区间

3.1 $\sigma^2$ 已知（z 区间）

3.2 $\sigma^2$ 未知（t 区间）

4. 正态总体方差的置信区间

5. 两个正态总体的置信区间

5.1 均值差 $\mu_1 - \mu_2$ 的置信区间

5.2 方差比 $\sigma_1^2/\sigma_2^2$ 的置信区间

6. 单侧置信限

7. 样本量的确定

参考文献

区间估计 ​

1. 区间估计的基本概念 ​

2. 枢轴量法 ​

3. 正态总体均值的置信区间 ​

3.1 σ2\sigma^2σ2 已知（z 区间） ​

3.2 σ2\sigma^2σ2 未知（t 区间） ​

4. 正态总体方差的置信区间 ​

5. 两个正态总体的置信区间 ​

5.1 均值差 μ1−μ2\mu_1 - \mu_2μ1​−μ2​ 的置信区间 ​

5.2 方差比 σ12/σ22\sigma_1^2/\sigma_2^2σ12​/σ22​ 的置信区间 ​

6. 单侧置信限 ​

7. 样本量的确定 ​

参考文献 ​

区间估计

1. 区间估计的基本概念

2. 枢轴量法

3. 正态总体均值的置信区间

3.1 $\sigma^2$ 已知（z 区间）

3.2 $\sigma^2$ 未知（t 区间）

4. 正态总体方差的置信区间

5. 两个正态总体的置信区间

5.1 均值差 $\mu_1 - \mu_2$ 的置信区间

5.2 方差比 $\sigma_1^2/\sigma_2^2$ 的置信区间

6. 单侧置信限

7. 样本量的确定

参考文献