机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf
- 上传者:m****
- 时间:2025/12/26
- 热度:61
- 0人点赞
- 举报
机器学习应用系列:强化学习驱动下的解耦时序对比选股模型。本报告提出了一种基于强化学习的解耦时序对比模型(DTLC_RL),该模型 通过特征空间解耦、对比学习表征增强以及正交约束保障独立性以及强化学习 动态融合,构建了一个兼具深度学习非线性预测能力与良好可解释性的选股框 架。在模型设计中,我们分别构建了面向市场系统风险(β空间)、个股特异 特征(α空间)和个股基本面信息(θ空间)的编码器,并通过对比学习与正 交约束提升各空间表征的区分度与互补性。在此基础上,引入强化学习近端策 略优化(PPO)算法以实现自适应调整各空间权重。
空间编码器构建:本文以时间卷积网络 TCN作为 beta空间特征的编码器,以 多尺度 Transformer 模型作为 Alpha空间编码器,以门控残差 MLP 作为 Theta 空间编码器。对各个空间分别进行收益预测训练,各空间编码器均能有效提取 目标信息,且生成因子具备一定选股能力。自 2019年 1月至 2025年 11月, Beta_TCN、Alpha_Transformer、Theta_ResMLP 因子 IC 分别为 0.0954、 0.1128、0.0485,多头组合前 10%年化收益率分别为 27.73%、32.66%以及 23.88%。除此之外,各空间训练得到的因子彼此间相关性较低且具备一定互 补性,为后续多空间融合奠定一定基础。
融合模型对照组实验:本文分别测试了两类空间融合对照组实验:1)直接对 三个空间训练出的因子进行等权求和;2)将三个空间的编码信息进行合并, 并通过单层线性层进行处理并接入预测头进行收益率预测。自 2019年 1月至 2025 年 11 月,DTLC 等权融合模型因子月平均 IC 为 0.1202,多头组合(前 10%)年化收益率 32.46%;线性融合 DTLC 模型因子月平均 IC 为 0.1239, 多头组合年化收益率 32.95%。
强化学习驱动空间融合:本文引入强化学习来实现空间的动态复权融合,即在 DTLC 模型的三个编码器后引入强化学习动态复权的空间融合机制。该部分将 三个子空间编码与市场环境特征共同输入策略网络,通过近端策略优化(PPO) 算法动态生成空间权重,实现自适应加权融合,最终通过预测头输出未来收益 率预测。自 2019年 1月至 2025年 11月,DTLC_RL 因子月平均 IC为 0.1250, 多头组合年化收益率 34.77%,显著优于 DTLC_Linear 多头表现。可见强化学 习空间融合机制的加入使得因子性能有所提升。
指数增强测试:自 2019 年 1月至 2025 年 11月,DTLC_RL 因子沪深 300指 数增强相对指数年化超额收益率 13.72%,近一个月、三个月、一年、三年超 额收益率分别为-0.87%、1.53%、14.99%以及 12.58%;DTLC_RL 因子中证 1000 指数增强相对指数年化超额收益率 20.37%,近一个月、三个月、一年、 三年超额收益率分别为 3.00%、4.52%、19.67%以及 13.76%。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何? 2244 6积分
- 清华大学-人工智能之机器学习.pdf 2230 40积分
- 机器学习和知识图谱在行业轮动中的应用.pdf 1536 6积分
- 亚马逊云科技7个典型的机器学习案例 1102 6积分
- 兰德-在中美竞争中保持人工智能和机器学习的竞争优势.pdf 1000 5积分
- 世界经济论坛-负责任地使用技术:Microsoft案例研究(英文) 960 6积分
- 机器学习资产配置:HMM模型择时及配置策略.pdf 923 5积分
- 德邦金工文献精译第一期:机器学习因子,在线性因子模型中捕获非线性.pdf 813 4积分
- 人人懂AI之从机器学习到大模型.pdf 690 10积分
- IDC白皮书:加快机器学习开发步伐,加速构建智能应用程序.pdf 649 4积分
- 2025年人工智能与机器学习在医疗科技领域的崛起研究报告(英文版).pdf 366 5积分
- 人工智能和机器学习系列专题研究:基于动量Transformer模型的日内和隔夜交易策略.pdf 238 5积分
- 基于可微RankIC损失函数的深度学习选股策略——机器学习选股系列研究之一.pdf 135 5积分
- 金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子.pdf 111 5积分
- 机器学习应用系列专题报告:DAFAT,基于Transformer模型的自适应解决方案.pdf 104 5积分
- 机器学习系列之一:mHC对Barra机器学习因子的改进.pdf 90 4积分
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf 86 3积分
- 机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf 62 5积分
- 克莱尔:一种用于韧性估计的因果机器学习方法(英译中).pdf 56 6积分
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf 22 4积分
