FIN-221 | Spring 2025 | Machine Learning in Finance | Quantopian
课程概览
本课程系统探讨机器学习在金融领域的理论与实践,聚焦数据治理、策略开发、回测验证等核心环节。通过平衡理论与工程实践,揭示机器学习在量化交易中的真实能力边界,重点解决金融场景下的过拟合、生存偏差、非平稳性等特殊挑战。适合具备统计学与编程基础(Python/R)的量化研究员、资管从业者及学术研究者。
课程模块与知识体系
模块1:金融数据工程(3周)
- 金融数据结构化
- Tick数据聚合、因子库构建、非同步交易数据处理
- 高频数据特征:报价跳变、微观结构噪声滤除
- 标签设计与样本权重
- 三重屏障法(Triple Barrier Method)定义交易信号
- 时间衰减权重应对市场状态迁移
- 特征分析与选择
- Meta-Labeling框架下的特征重要性评估
- 对抗特征筛选(对抗性验证检测信息泄漏)
模块2:模型构建与验证(4周)
- 集成学习方法
- 随机森林与梯度提升树在因子合成中的对比
- 堆叠泛化(Stacking)整合基本策略信号
- 金融场景交叉验证
- Purged K-Fold方法消除前瞻偏差
- 时间序列交叉验证的滚动窗口设计
- 超参数优化陷阱
- 过拟合风险:Walk-Forward优化 vs 网格搜索
- 参数稳定性检验(参数敏感性分析)
模块3:策略回测与风控(3周)
- 回测引擎设计
- 事件驱动回测 vs 向量化回测的算力权衡
- 滑点模型:固定滑点 vs 订单簿仿真
- 回测统计量体系
- 收益指标:夏普比率、Calmar比率、策略容量
- 风险指标:最大回撤、VaR、策略拥挤度监测
- 策略风险拆解
- 过拟合概率估计(Deflated Sharpe Ratio)
- 蒙特卡洛交叉验证(Monte Carlo PnL分布分析)
模块4:前沿应用专题(2周)
- 机器学习资产配置
- 风险平价模型(Risk Parity)的神经网络优化
- 带交易约束的强化学习动态调仓
- 微观结构特征挖掘
- 订单流失衡(Order Flow Imbalance)预测短期价格
- 限价订单簿动态的LSTM建模