量化专题报告:StockFormer,基于Transformer的强化学习模型探究.pdf
- 上传者:0*****
- 时间:2024/07/31
- 热度:855
- 0人点赞
- 举报
量化专题报告:StockFormer,基于Transformer的强化学习模型探究。强化学习通过训练智能体直接输出投资决策。强化学习是一种机器学习方 法,通过与环境的交互来训练智能体,使其在不同状态下采取能够最大化累积 奖励的行动。在强化学习中,智能体(Agent)通过与环境的互动不断学习, 通过奖励和惩罚来调整其策略,以便在长期内获得最大回报。在股票市场中, 强化学习可以通过市场状态的输入,不断调整交易策略,最大化长期的投资回 报。强化学习在金融领域中的应用主要在状态输入,奖励函数及优化算法三个 方面进行了创新。
SAC强化学习加入多项改进以避免模型过拟合。在SAC中,价值网络是一 个双Q网络(Double DQN),即使用两个独立的Q网络的同时对目标函数进 行估计,在目标值计算时选择最小的一个,从而降低 Q 值的高估风险,防止模 型陷入局部最优或者过拟合。此外,SAC 在策略优化过程中引入了熵正则化 项,熵正则化项的引入使得策略在早期阶段保持一定的随机性,避免策略网络 和价值网络的学习模式过于重合以陷入局部最优,从而提高整体的策略探索能 力。对于熵正则项,SAC还引入了自适应熵系数α,通过优化熵系数来自动调整 策略的探索程度,使得模型能够根据当前的训练情况动态调整探索与开发的平 衡。
StockFormer 模型利用 Transformer 深度学习进行预测并优化交易决策。Siyu Gao 等人在 2023 年 IJCAI 上发表的论文 StockFormer: Learning Hybrid Trading Machines with Predictive Coding 中采用 SAC 强化学习作为 基础框架,并采用了3个Transformer 模型分别预测市场相关状态,短期收益 状态与长期收益状态作为强化学习的输入状态。然后在SAC强化学习中将3个 隐状态进行合成,在组合状态空间中优化交易决策。利用沪深 300 成分股做训 练,取得了优于基线Transformer模型的效果。
深度学习+强化学习较深度学习+组合优化收益弹性更高。我们将 Transformer 模型作为本篇研究中的基模型构建 Transformer 因子的指数增强 组合,再与 Transformer+SAC 强化学习算法形成对照。在 Transformer 模型 中,我们采用日频行情与20个日频技术因子作为输入,预测个股周度收益排序 作为因子,构建的指数增强组合2019年以来在中证1000内年化收益17.2%, 超额收益13.8%,信息比率2.36,表现稳定。在StockFormer模型中,我们替 换奖励函数为超额收益-跟踪误差-交易费用,并修改前3个Transformer模型, 输出每日交易行为与持仓,策略年化收益 32.7%,超额收益 29.1%,信息比率 2.57,超额收益波动率较大,但主要为上行波动,模型总体好于 Transformer 的指数增强组合。对策略持仓进行风格分析,发现模型对于市场主线识别能力 较强,通过风格择时带来一定超额收益。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 量化投资-因子表现与模型解释力度分析:CNE7经典版多因子模型.pdf 2214 6积分
- 量化视角下的信用+货币周期与资产配置.pdf 1543 5积分
- 量化策略专题:行业选择逻辑与行业配置策略.pdf 964 6积分
- 黄金、白银量化研究.pdf 896 5积分
- 量化专题报告:StockFormer,基于Transformer的强化学习模型探究.pdf 856 5积分
- A股量化择时研究报告:关注基本面趋势策略.pdf 714 5积分
- 量化策略专题研究:量化视角下的风格、行业运行逻辑及配置展望.pdf 650 6积分
- 2021年下半年量化投资策略:复苏新预期,策略新布局 625 5积分
- 量化投资策略报告:数字正弦波择时系列之二,券商板块择时模型研究.pdf 485 5积分
- 量化专题报告:从增量学习到元学习,深度学习训练新框架.pdf 440 5积分
- 量化专题报告:可转债的归因、估值、配置全解析.pdf 311 5积分
- 量化工具箱系列专题报告:全市场主题轮动“录像机”.pdf 269 4积分
- 中银量化行业轮动系列(十三):中银量化行业轮动全解析.pdf 203 5积分
- 量化研究系列报告:临界相变,探寻传统因子中的非线性基因.pdf 178 5积分
- 量化专题报告:“量价淘金”选股因子系列研究(十五),高低位放量事件簇,正负向信号的有机结合.pdf 164 5积分
- 量化专题报告:威科夫点数图的绘制与应用,股票涨跌空间判断.pdf 162 5积分
- 量化行业比较系列专题报告:基于资本开支周期的行业比较与轮动策略.pdf 149 5积分
- 基本面量化系列专题报告:成长因子改造手册.pdf 144 6积分
- 量化专题报告:深度风险模型与强化风险模型的构建及组合优化.pdf 130 5积分
- 量化研究系列报告:因材施“策”,量化视角下的因子舒适区探寻与应用.pdf 123 5积分
- 量化研究系列报告之二十五:高弹性Alpha的量化掘金,从盲区识别到策略构建.pdf 107 5积分
- 量化基本面系列之三:业绩预告与行业表现呈现分化.pdf 83 3积分
- 量化看市场系列之七:使用OpenClaw快速搭建AI助理团队.pdf 67 5积分
- 量化分析:三月行情展望.pdf 45 6积分
- 量化专题报告:“量价淘金”选股因子系列研究(十六),异动雷达事件簇,寻找“与众不同”的个股.pdf 34 3积分
- 金工深度研究:量化行业轮动的“崎岖之路”.pdf 29 3积分
- 小米&荣耀:2025移动终端智能体隐私安全白皮书.pdf 235 40积分
- Agent新春特刊——智能体的形态演进与治理思考_阿里研究院.pdf 58 6积分
