<aside> 💡
查看全集:概率与统计/Probability & Statistics
</aside>
设 $X_1, X_2, ..., X_n$ 为从均值为 $\mu$、方差为 $\sigma^2$ 的总体中随机抽取的样本,则:
$$ \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i $$
为样本均值(Sample Mean)。它是总体均值 $\mu$ 的无偏估计(Unbiased Estimator):
$$ E(\bar{X}) = \mu $$
样本均值的标准差称为标准误:
$$ \text{SE} = \sqrt{\text{Var}(\bar{X})} = \frac{\sigma}{\sqrt{n}} $$
实际中常用样本标准差 $s$ 近似:
$$ \text{SE} \approx \frac{s}{\sqrt{n}}, \quad s^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 $$
例子:
若总体 $\sigma=5$,样本量 $n=25$,则: $\text{SE} = \frac{5}{\sqrt{25}} = 1$ 表示样本均值 $\bar{X}$ 与真实均值 $\mu$ 的典型距离约为1。
设真实参数为 $w$,但测量值存在系统性偏差 $b$:
$$ X_i = w + b + \epsilon_i, \quad \epsilon_i \sim (0, \sigma^2) $$