2025年因子选股系列专题报告:Neural ODE,时序动力系统重构下深度学习因子挖掘模型
- 来源:东方证券
- 发布时间:2025/05/28
- 浏览次数:302
- 举报
因子选股系列专题报告:Neural ODE,时序动力系统重构下深度学习因子挖掘模型.pdf
因子选股系列专题报告:NeuralODE,时序动力系统重构下深度学习因子挖掘模型。研究结论金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题,这些问题通常会影响模型稳定性以及样本外的泛化能力。本文提出一种RNN+NeuralODE+MLP融合模型,将时序数据建模为微分动力系统,然后进行数据重构和特征提取,从而提升模型样本外的选股鲁棒性。整个模型由以下部分构成: 通过RNN和NeuralODE模型构建变分自编码层(VAE层),利用RNN进行时序数据的压缩和降维,再将神经微分方程(NeuralODE)学习时序数据隐含的时序演化规律,将数据进行去噪和重构。 最后...
一、新模型细节介绍
1.1 神经网络与微分方程的联系
传统神经网络在处理高维空间数据时往往需要使用较多的非线性层,每一层通过前一层的输 出来提取特征,所以随着神经网络层数的增多,训练时反向传播过程伴随着会出现梯度爆炸和梯 度消失等问题使得神经网络无法有效提取数据中的有效信息甚至训练失败。而残差网络 (Residual Network,ResNet)则通过构建跳跃连接(skip connection)允许梯度直接回传至浅 层,从而缓解了深层网络训练时普遍存在的梯度消失与网络退化问题,使得构建超深层网络成为 可能。残差连接本质上是构建了恒等映射(Identity Mapping)的捷径路径,使网络在无需额外参 数的情况下学习输入与输出的残差(即增量变化),实验表明这种设计显著提升了模型对复杂特 征的提取能力。

1.2 本文模型结构和损失函数
本文中模型结构可以分为三部分构成,分别为 Encoder 层、Decoder 层和 MLP 层,这里 Encoder 和 Decoder 层合称为变分自编码层(VAE)层,其中 Encoder 层为 RNN 结构作用主要 是进行数据降维和特征提取,而 Decoder 层为 Neural Jump SDE 结构主要作用是拟合时序数据的 时间衍化规律,从而对数据进行重构。MLP 层主要是对重构数据进行特征提取,最终对个股未来 收益率进行预测。
MLP层有两种设置方案,第一种为全连接层和非线性激活函数构成,此时我们使用预测结果 和中性化标准化后的收益率标签直接计算均方误差损失,第二种则是采用我们前期报告《ABCM: 基于神经网络的 alpha 和 beta 因子协同挖掘模型》中的结构,即通过两个 NN-Layer 同时生成风 险因子和 alpha 因子,风险因子使用的 NN-Layer 为带 Attention 机制的图结构其对应损失函数为 R-square,alpha 因子的 NN-Layer 为简单的全连接层其对应损失函数为 MSE,最后通过构建因 子正交惩罚损失来剥离 alpha 和风险信息。
1.3 新模型重构数据表现
我们使用新模型对股票预处理后的 K 线数据进行重构,取 2013~2022 年为训练集,2023 年 为验证集,2024 年为样本外,训练时只使用重构损失和 KL 散度作为损失函数,统计验证集以及 样本外重构损失表现,重构损失使用原始数据与重构数据的 MSE损失作为度量的量。
二、模型生成因子表现分析
2.1 回测说明
本文的回测结果中,回测区间为 20171229~20250430,若不做特殊说明,各项指标计算方 法如下所示: 1. RankIC 均值是当天因子与隔日未来十日收益率(T+1~T+11 收盘)序列进行计算的,并且 每隔十个交易日计算一次,最终将这个 RankIC 序列取平均得到的。 2. ICIR 则是根据上述 RankIC 序列均值除以序列标准差计算得到的。 3. 分组测试结果中,计算 top 组的年化超额收益,中证全指股票池上我们是将股票池分成 20 组,基准则是成分股等权,周度调仓,次日收盘价成交并且不考虑交易成本计算得到的。 4. 多头组周均单边换手率是根据多头组持仓计算得到,而最大回撤和年化波动率则是根据 top 组超额收益净值计算得到的。 5. 各个股票池均剔除了北交所股票以及上市天数较短的股票。 并且本文将对比以下模型的绩效表现,来说明新模型对原模型的增量作用: 1. Baseline:报告《ABCM:基于神经网络的 alpha 和 beta 因子协同挖掘模型》中的模型 生成因子。2. Model1:Neural ODE 模型生成因子截面标准化后与 Baseline 因子截面标准化后等权。 3. Model2:Neural SDE 模型生成因子截面标准化后与 Baseline 因子截面标准化后等权。 4. Model3:Model1 因子剥离掉相关短期风险因子后的残差。
2.2 因子中证全指绩效分析
首先,本节我们将展示上述模型生成的因子在中证全指股票池上的选股汇总效果、分年度的 超额收益表现以及超额收益的净值走势(其中汇总表现分成 2018 年至 2023 年和 2024 年以及 2025 年三段进行展示)。

2.3 因子与各风格因子相关性分析
本节我们分析了所生成因子与各个风险因子的平均相关性结果,可以看出虽然 Model3 因子 是在 Model1 因子的基础上剥离掉了短期风险,但整体来看,Model3 因子在一些风格上的暴露更 高比如 Beta、Volatility、Liquidity、Value 和 Certainty 等。
三、周频行业轮动绩效分析
本章将展示新模型因子应用于行业轮动策略的绩效表现,回测结果有如下说明: 行业因子合成方法:将选股因子按照行业进行聚合形成行业的得分,聚合时权重设置为个股 的流通市值。 备选行业池:所有 30 个中信一级行业。 组合构建方式:取行业因子排名 Top5 的行业等权构建组合,基准为 30 个行业收益率等权, 调仓频率为周频,每周五以收盘价格进行买卖交易。
四、Top 与指数增强组合表现
4.1 组合构建说明
本章将展示了新模型生成因子构建 Top30 组合以及在沪深 300、中证 500 和中证 1000 指数 增强的应用效果,关于指数增强组合有如下说明: 1) 回测期 20180101~20250430,组合周频调仓,假设根据每周五个股得分在次日(即下周一) 以 vwap 价格进行交易,股票池为中证全指剔除北交所股票和上市天数较短的股票。 2) 风险因子库 dfrisk2020(参见《东方 A 股因子风险模型(DFQ-2020)》)的所有风格因子相对 暴露不超过 0.5,所有行业因子相对暴露不超过 2%,中证 500 增强跟踪误差约束不超过 5%, 沪深 300 增强跟踪误差约束不超过 4%。个股权重偏离设置为±1%。 3) 指增策略组合构建时,限制指数成分股占比,成分股占比约束为 80%,周单边换手率限制记 为 20%。 4) 组合业绩测算时假设买入成本千分之一、卖出成本千分之二,停牌和涨停不能买入、停牌和 跌停不能卖出。
4.2 Top 组合业绩
各模型构建的 Top 组合各年度绝对收益均为正,且 Model1 和 Model2 因子构建的组合绝对 收益、夏普比率和最大回撤相较于 Baseline 因子均有明显提升,说明相较于基准模型,新模型能 够获取更强更稳定的头部收益。Model1 和 Model2 因子绝对净值最大回撤区间发生在时点 2024 年2月,最大回撤达到-40.31%;第二大回撤区间发生在时点2022年4月,最大回撤达到-30.11%。 其余时间最大回撤均小于 20%。可见组合的绝对收益较为稳定。
4.3 沪深 300 指数增强
在相应约束条件下,因子所构建的沪深 300 指增组合表现良好, Model1、Model2 的年化超额超过 16%,超额的夏普比率分别为 3.14 和 3.15,组合各项指标均显 著超过 Baseline 因子构建组合,除 2019 年每年超额均在 7%以上。今年面临年初的科技股暴涨的 极端行情,组合依然有较为稳健的表现,截至 20250430,组合累积超额达到 4.37%和 4.66%。

4.4 中证 500 指数增强
在相应约束条件下,因子所构建的中证 500 指增组合表现较好, Model1 和 Model2 的年化超额超过 21%,组合各项指标均显著超过 Baseline 因子构建组合,超 额夏普比率可达 3.21、3.23。2024 年以前组合超额均超过 10%,但近两年超额有所下滑,且今 年各组合业绩表现较为一般,截至 20250430,组合累积超额均不到 3%。
4.5 中证 1000 指数增强 本节将展示各个模型生成因子在中证100
在相应约束条件下,因子所构建的中证 1000指增组合表现优异,其 中 Model1 和 Model2 年化超额均超过 31%,超额夏普比率分别 4.37 和 4.25,组合各项指标均显 著超过 Baseline 因子构建组合,2023 年以前组合超额均在 20%以上,但近年来组合超额表现有 所下滑。今年组合业绩表现也较为不俗,截至 20250430,组合累积超额高达 5.20 和 6.08%。
五、结论
前期报告中,我们基于基本面(fund)、周度(week)、日度(day)、分钟线(ms)和 Level-2(l2)五个数据集,利用带图结构的 RNN、ResNet 和决策树模型搭建了 AI 量价模型框架, 并将该框架生成的最终打分应用于选股策略,回测结果显示这套框架下生成的因子有着较强的选 股能力。 金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题,这些问题通 常会影响模型稳定性以及样本外的泛化能力。本文提出一种 RNN+Neural ODE+MLP 融合模型, 将时序数据建模为微分动力系统,通过 RNN 和 Neural ODE 模型构建变分自编码层(VAE 层), 利用 RNN 进行时序数据的压缩和降维,再将神经微分方程(Neural ODE)学习时序数据隐含的 时序演化规律,将数据进行重构,最后我们将重构去噪后的数据输入 MLP 模型进行 alpha 信息的 捕捉和挖掘,从而提升模型样本外的选股鲁棒性。
通过将 Baseline 模型和新模型因子多头绩效的对比,我们得到以下结论: 1. 相较于 Baseline 模型,除 2020 年和今年,其余各年份 Model1 因子的多头超额均能大幅跑 赢。而分组超额来看,Model1的 Top 组和 Grp1 组超额相较于 Baseline 模型分别提升了 1.91% 和 3.07%,说明新模型相对于 Baseline 能大幅改善多头的表现。 2. 在 2024 年出现较为极端的市场环境下,Model1 因子多头超额相较于 Baseline 模型提升了 6.63%,最大回撤也有所下降,说明 Model1 抗风险能力相对更强。 3. 在各个回测区间,Model1 因子的多头组合换手率相较于 Baseline 均有一定程度的下降。这 意味着实盘可能有更高的交易成本优势。 4. Baseline 模型和 Model1 模型多头超额净值走势趋同度较高,各年度的最大回撤区间基本上 重合,说明各类模型从相同量价特征中提取的 alpha 信息一致性相对较高。 新模型 2018 年以来在中证全指上十日 RankIC 均值为 16.33%,top 组年化超额分别为 54.54%。相较于基准,新模型选股效果均有明显提升。行业轮动方面,2018 年以来,新模型 RankIC 可达 12.55%,Top 组年化超额可达 25.27%,各项指标表现也显著战胜基准。 本文生成因子也可以直接应用于指数增强策略,在各宽基指数上均能获得显著的超额收益, 在成分股不低于 80%限制、周单边换手率为 20%约束下,在沪深 300、中证 500 和中证 1000 增 强策略上 2018 年以来新模型年化超额收益率分别为 16.67%,21.37%和 32.41%,超额的夏普比 率分别为 3.14、3.21、4.37。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf
- 泛科技框架重构及选股模型初探.pdf
- 投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来.pdf
- “十五五”之六大未来产业图谱及选股框架:掘金未来.pdf
- 科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603).pdf
- 中国动力:船用动力系统龙头格局稳固,后市场、燃机打开新空间.pdf
- 乘联会:汽车先进动力系统技术发展报告(2025版).pdf
- 低空经济行业专题报告:eVTOL动力系统的市场空间、技术趋势和产业链机遇.pdf
- 英搏尔研究报告:新能源动力系统领军者,低空经济新星蓄势待发.pdf
- 秦安股份研究报告:深耕动力系统轻量化结构件,顺利转型新能源市场.pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 Transformer架构下的量价选股策略:ChatGPT核心算法应用于量化投资.pdf
- 2 量化选股策略:基于卷积神经网络的股价走势AI识别与分类.pdf
- 3 因子选股系列之九十四:UMR2.0,风险溢价视角下的动量反转统一框架再升级.pdf
- 4 ChatGPT应用分析:ChatGPT在择时、风格、行业、选股中的应用实践.pdf
- 5 美股市场基础研究:标普500,从选股规则到财务分析.pdf
- 6 定增选股对冲策略实战探讨.pdf
- 7 低估值央国企的超额收益持续性研究及选股思路.pdf
- 8 量化基本面系列报告之八:寻找选股策略与行业轮动策略的“舒适区”.pdf
- 9 美股市场基础研究:标普红利、质量与增强价值指数的选股思路与历史表现.pdf
- 10 量化策略专题研究:科技板块和新能源板块产业选股.pdf
- 1 因子选股系列专题报告:基于历史K线形态的因子选股研究.pdf
- 2 多因子选股系列研究报告:个股日内成交量分布特征与日内流动性弹性刻画.pdf
- 3 多因子选股系列研究之二十四:个股日内成交量周期性节奏刻画与“滴水穿石”因子构建.pdf
- 4 “量价淘金”选股因子系列研究:“高频数据+离散化构建方式”在因子研究中的重要性.pdf
- 5 量化投资因子选股系列专题报告:DFQ_diversify,解决分布外泛化问题的自监督领域识别与对抗解耦模型.pdf
- 6 因子选股系列专题报告:Neural ODE,时序动力系统重构下深度学习因子挖掘模型.pdf
- 7 PINN信息约束与时序截面双流网络选股模型分析.pdf
- 8 高频选股因子周报:高频整体表现优异,多粒度因子维持正收益。AI增强组合超额持续回撤.pdf
- 9 策略化选股月报:7月六大策略均录得正收益,科创板策略单月超额收益超9%.pdf
- 10 金工深度研究:基于level2数据图像的选股模型.pdf
- 1 多因子选股系列研究之二十四:个股日内成交量周期性节奏刻画与“滴水穿石”因子构建.pdf
- 2 高频选股因子周报:高频整体表现优异,多粒度因子维持正收益。AI增强组合超额持续回撤.pdf
- 3 金工深度研究:基于level2数据图像的选股模型.pdf
- 4 高频和行为金融学选股因子跟踪周报:国防军工行业拥挤度较高,有限关注类因子表现较好.pdf
- 5 银河金工主题选股系列报告:成长盈利现金流三足鼎立,消费基本面量化多维制胜.pdf
- 6 量化选股策略更新.pdf
- 7 量化选股策略更新.pdf
- 8 金工因子研究系列专题1:委托挂单手数蕴含的选股信息.pdf
- 9 红利选股的战略三角:进攻、防守和交易.pdf
- 10 “十五五”之六大未来产业图谱及选股框架:掘金未来.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年泛科技框架重构及选股模型初探
- 2 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 3 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 4 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 5 2026年量化选股策略更新
- 6 2026年金工深度研究:大模型概念与宏观热点选股
- 7 2026年量化选股策略更新
- 8 2026年金工因子研究系列专题1:委托挂单手数蕴含的选股信息
- 9 2026年第4周高频和行为金融学选股因子跟踪周报:建材行业扩散指标走强,流动性类因子表现较好
- 10 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 1 2026年泛科技框架重构及选股模型初探
- 2 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 3 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 4 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 5 2026年量化选股策略更新
- 6 2026年金工深度研究:大模型概念与宏观热点选股
- 7 2026年量化选股策略更新
- 8 2026年金工因子研究系列专题1:委托挂单手数蕴含的选股信息
- 9 2026年第4周高频和行为金融学选股因子跟踪周报:建材行业扩散指标走强,流动性类因子表现较好
- 10 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 1 2026年泛科技框架重构及选股模型初探
- 2 2026年投资策略:“十五五”之六大未来产业图谱及选股框架,掘金未来
- 3 2026年“十五五”之六大未来产业图谱及选股框架:掘金未来
- 4 2026年科创策略、情绪价量策略收益显著,3月推荐电子机械股——策略化选股月报(202603)
- 5 2026年量化选股策略更新
- 6 2026年金工深度研究:大模型概念与宏观热点选股
- 7 2026年量化选股策略更新
- 8 2026年金工因子研究系列专题1:委托挂单手数蕴含的选股信息
- 9 2026年第4周高频和行为金融学选股因子跟踪周报:建材行业扩散指标走强,流动性类因子表现较好
- 10 2026年深度学习系列之一:在线学习增强选股模型的适应性
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
