<aside> 💡
查看全集:Quantopia量化分析56讲
</aside>
参数是描述数据集或概率分布的统计量。例如:
关键公式:
正态分布概率密度函数:
$$ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$
所有参数估计都存在不确定性:
样本均值 μ^=n1∑xi 是真实均值μ的估计
$$ \hat{\mu} = \frac{1}{n}\sum x_i $$
估计值会随样本变化而波动
需通过标准误差/置信区间评估估计质量
import numpy as np
import matplotlib.pyplot as plt
np.random.seed(123)
normal_data = np.random.randn(500)
# 不同样本量的均值估计
print(f"10样本均值: {np.mean(normal_data[:10]):.2f}")
print(f"250样本均值: {np.mean(normal_data[:250]):.2f}")
# 绘制累积分布直方图
plt.hist([normal_data[:10], normal_data[:100], normal_data],
bins=30, stacked=True, density=True)
plt.xlabel('Value')
plt.ylabel('Frequency Density')
双峰分布示例:
def generate_bimodal(n):
choice = np.random.binomial(1, 0.5, n)
return np.where(choice, np.random.normal(5,1,n),
np.random.normal(-5,1,n))
bimodal_data = generate_bimodal(1000)
# Jarque-Bera正态性检验
from statsmodels.stats.stattools import jarque_bera
jb_value, pvalue = jarque_bera(bimodal_data)[:2]
print(f"P值: {pvalue:.4f}") # 通常<0.05拒绝正态假设