基础概念
从点估计到区间估计
设独立同分布随机变量$X_1,...,X_n$服从均值为$\mu$、方差为$\sigma^2$的分布:
- 样本均值 (Sample Mean):
\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
- 样本方差 (Sample Variance):
s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2
- 标准误 (Standard Error, SE):
SE = \frac{s}{\sqrt{n}}
点估计通过$\bar{x} \pm SE$给出估计范围,但无法量化置信程度。区间估计通过构建置信区间 (Confidence Interval) 解决这一缺陷。
核心思想
置信区间满足:
Pr(\mu \in [L,U]) = 1-\alpha
其中:
- $L,U$为区间端点
- $1-\alpha$为置信水平 (Confidence Level)
- $\alpha$为显著性水平 (Significance Level)
正态分布下的置信区间
标准正态分位数
设$Z \sim N(0,1)$,定义上尾分位数 (Upper-tail Quantile) $z_p$满足:
Pr(Z > z_p) = p
特别地:
- $z_{0.5} = 0$(中位数)
- $Pr(-z_p \leq Z \leq z_p) = 1-2p$(对称区间概率)
置信区间构建
当满足以下条件之一时: