<aside> 💡

查看全集:概率与统计/Probability & Statistics

</aside>

pic.svg

1. 样本均值与标准误(Sample Mean & Standard Error)

1.1 基本定义

设 $X_1, X_2, ..., X_n$ 为从均值为 $\mu$、方差为 $\sigma^2$ 的总体中随机抽取的样本,则:

$$  \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i  $$

样本均值(Sample Mean)。它是总体均值 $\mu$ 的无偏估计(Unbiased Estimator):

$$  E(\bar{X}) = \mu  $$

1.2 标准误(Standard Error, SE)

样本均值的标准差称为标准误

$$  \text{SE} = \sqrt{\text{Var}(\bar{X})} = \frac{\sigma}{\sqrt{n}}   $$

实际中常用样本标准差 $s$ 近似:

$$  \text{SE} \approx \frac{s}{\sqrt{n}}, \quad s^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2  $$

例子

若总体 $\sigma=5$,样本量 $n=25$,则: $\text{SE} = \frac{5}{\sqrt{25}} = 1$ 表示样本均值 $\bar{X}$ 与真实均值 $\mu$ 的典型距离约为1。


2. 偏差与均方误差(Bias & Mean Squared Error)

2.1 偏差(Bias)

设真实参数为 $w$,但测量值存在系统性偏差 $b$:

$$  X_i = w + b + \epsilon_i, \quad \epsilon_i \sim (0, \sigma^2)   $$