2025年因子选股系列专题报告：Neural ODE，时序动力系统重构下深度学习因子挖掘模型

来源：东方证券
发布时间：2025/05/28
浏览次数：303
举报

相关深度报告REPORTS

因子选股系列专题报告：Neural ODE，时序动力系统重构下深度学习因子挖掘模型.pdf

因子选股系列专题报告：NeuralODE，时序动力系统重构下深度学习因子挖掘模型。研究结论金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题，这些问题通常会影响模型稳定性以及样本外的泛化能力。本文提出一种RNN+NeuralODE+MLP融合模型，将时序数据建模为微分动力系统，然后进行数据重构和特征提取，从而提升模型样本外的选股鲁棒性。整个模型由以下部分构成：通过RNN和NeuralODE模型构建变分自编码层（VAE层），利用RNN进行时序数据的压缩和降维，再将神经微分方程（NeuralODE）学习时序数据隐含的时序演化规律，将数据进行去噪和重构。最后...

一、新模型细节介绍

1.1 神经网络与微分方程的联系

传统神经网络在处理高维空间数据时往往需要使用较多的非线性层，每一层通过前一层的输出来提取特征，所以随着神经网络层数的增多，训练时反向传播过程伴随着会出现梯度爆炸和梯度消失等问题使得神经网络无法有效提取数据中的有效信息甚至训练失败。而残差网络（Residual Network，ResNet）则通过构建跳跃连接（skip connection）允许梯度直接回传至浅层，从而缓解了深层网络训练时普遍存在的梯度消失与网络退化问题，使得构建超深层网络成为可能。残差连接本质上是构建了恒等映射（Identity Mapping）的捷径路径，使网络在无需额外参数的情况下学习输入与输出的残差（即增量变化），实验表明这种设计显著提升了模型对复杂特征的提取能力。

1.2 本文模型结构和损失函数

本文中模型结构可以分为三部分构成，分别为 Encoder 层、Decoder 层和 MLP 层，这里 Encoder 和 Decoder 层合称为变分自编码层（VAE）层，其中 Encoder 层为 RNN 结构作用主要是进行数据降维和特征提取，而 Decoder 层为 Neural Jump SDE 结构主要作用是拟合时序数据的时间衍化规律，从而对数据进行重构。MLP 层主要是对重构数据进行特征提取，最终对个股未来收益率进行预测。

MLP层有两种设置方案，第一种为全连接层和非线性激活函数构成，此时我们使用预测结果和中性化标准化后的收益率标签直接计算均方误差损失，第二种则是采用我们前期报告《ABCM：基于神经网络的 alpha 和 beta 因子协同挖掘模型》中的结构，即通过两个 NN-Layer 同时生成风险因子和 alpha 因子，风险因子使用的 NN-Layer 为带 Attention 机制的图结构其对应损失函数为 R-square，alpha 因子的 NN-Layer 为简单的全连接层其对应损失函数为 MSE，最后通过构建因子正交惩罚损失来剥离 alpha 和风险信息。

1.3 新模型重构数据表现

我们使用新模型对股票预处理后的 K 线数据进行重构，取 2013~2022 年为训练集，2023 年为验证集，2024 年为样本外，训练时只使用重构损失和 KL 散度作为损失函数，统计验证集以及样本外重构损失表现，重构损失使用原始数据与重构数据的 MSE损失作为度量的量。

二、模型生成因子表现分析

2.1 回测说明

本文的回测结果中，回测区间为 20171229~20250430，若不做特殊说明，各项指标计算方法如下所示： 1. RankIC 均值是当天因子与隔日未来十日收益率（T+1~T+11 收盘）序列进行计算的，并且每隔十个交易日计算一次，最终将这个 RankIC 序列取平均得到的。 2. ICIR 则是根据上述 RankIC 序列均值除以序列标准差计算得到的。 3. 分组测试结果中，计算 top 组的年化超额收益，中证全指股票池上我们是将股票池分成 20 组，基准则是成分股等权，周度调仓，次日收盘价成交并且不考虑交易成本计算得到的。 4. 多头组周均单边换手率是根据多头组持仓计算得到，而最大回撤和年化波动率则是根据 top 组超额收益净值计算得到的。 5. 各个股票池均剔除了北交所股票以及上市天数较短的股票。并且本文将对比以下模型的绩效表现，来说明新模型对原模型的增量作用： 1. Baseline：报告《ABCM：基于神经网络的 alpha 和 beta 因子协同挖掘模型》中的模型生成因子。2. Model1：Neural ODE 模型生成因子截面标准化后与 Baseline 因子截面标准化后等权。 3. Model2：Neural SDE 模型生成因子截面标准化后与 Baseline 因子截面标准化后等权。 4. Model3：Model1 因子剥离掉相关短期风险因子后的残差。

2.2 因子中证全指绩效分析

首先，本节我们将展示上述模型生成的因子在中证全指股票池上的选股汇总效果、分年度的超额收益表现以及超额收益的净值走势（其中汇总表现分成 2018 年至 2023 年和 2024 年以及 2025 年三段进行展示）。

2.3 因子与各风格因子相关性分析

本节我们分析了所生成因子与各个风险因子的平均相关性结果，可以看出虽然 Model3 因子是在 Model1 因子的基础上剥离掉了短期风险，但整体来看，Model3 因子在一些风格上的暴露更高比如 Beta、Volatility、Liquidity、Value 和 Certainty 等。

三、周频行业轮动绩效分析

本章将展示新模型因子应用于行业轮动策略的绩效表现，回测结果有如下说明：行业因子合成方法：将选股因子按照行业进行聚合形成行业的得分，聚合时权重设置为个股的流通市值。备选行业池：所有 30 个中信一级行业。组合构建方式：取行业因子排名 Top5 的行业等权构建组合，基准为 30 个行业收益率等权，调仓频率为周频，每周五以收盘价格进行买卖交易。

四、Top 与指数增强组合表现

4.1 组合构建说明

本章将展示了新模型生成因子构建 Top30 组合以及在沪深 300、中证 500 和中证 1000 指数增强的应用效果，关于指数增强组合有如下说明： 1）回测期 20180101~20250430，组合周频调仓，假设根据每周五个股得分在次日（即下周一）以 vwap 价格进行交易，股票池为中证全指剔除北交所股票和上市天数较短的股票。 2）风险因子库 dfrisk2020（参见《东方 A 股因子风险模型（DFQ-2020）》）的所有风格因子相对暴露不超过 0.5，所有行业因子相对暴露不超过 2%，中证 500 增强跟踪误差约束不超过 5%，沪深 300 增强跟踪误差约束不超过 4%。个股权重偏离设置为±1%。 3）指增策略组合构建时，限制指数成分股占比，成分股占比约束为 80%，周单边换手率限制记为 20%。 4）组合业绩测算时假设买入成本千分之一、卖出成本千分之二，停牌和涨停不能买入、停牌和跌停不能卖出。

4.2 Top 组合业绩

各模型构建的 Top 组合各年度绝对收益均为正，且 Model1 和 Model2 因子构建的组合绝对收益、夏普比率和最大回撤相较于 Baseline 因子均有明显提升，说明相较于基准模型，新模型能够获取更强更稳定的头部收益。Model1 和 Model2 因子绝对净值最大回撤区间发生在时点 2024 年2月，最大回撤达到-40.31%；第二大回撤区间发生在时点2022年4月，最大回撤达到-30.11%。其余时间最大回撤均小于 20%。可见组合的绝对收益较为稳定。

4.3 沪深 300 指数增强

在相应约束条件下，因子所构建的沪深 300 指增组合表现良好， Model1、Model2 的年化超额超过 16%，超额的夏普比率分别为 3.14 和 3.15，组合各项指标均显著超过 Baseline 因子构建组合，除 2019 年每年超额均在 7%以上。今年面临年初的科技股暴涨的极端行情，组合依然有较为稳健的表现，截至 20250430，组合累积超额达到 4.37%和 4.66%。

4.4 中证 500 指数增强

在相应约束条件下，因子所构建的中证 500 指增组合表现较好， Model1 和 Model2 的年化超额超过 21%，组合各项指标均显著超过 Baseline 因子构建组合，超额夏普比率可达 3.21、3.23。2024 年以前组合超额均超过 10%，但近两年超额有所下滑，且今年各组合业绩表现较为一般，截至 20250430，组合累积超额均不到 3%。

4.5 中证 1000 指数增强本节将展示各个模型生成因子在中证100

在相应约束条件下，因子所构建的中证 1000指增组合表现优异，其中 Model1 和 Model2 年化超额均超过 31%，超额夏普比率分别 4.37 和 4.25，组合各项指标均显著超过 Baseline 因子构建组合，2023 年以前组合超额均在 20%以上，但近年来组合超额表现有所下滑。今年组合业绩表现也较为不俗，截至 20250430，组合累积超额高达 5.20 和 6.08%。

五、结论

前期报告中，我们基于基本面（fund）、周度（week）、日度（day）、分钟线（ms）和 Level-2（l2）五个数据集，利用带图结构的 RNN、ResNet 和决策树模型搭建了 AI 量价模型框架，并将该框架生成的最终打分应用于选股策略，回测结果显示这套框架下生成的因子有着较强的选股能力。金融数据常因停牌、财报发布和突发事件等因素存在缺失、噪声及异常等问题，这些问题通常会影响模型稳定性以及样本外的泛化能力。本文提出一种 RNN+Neural ODE+MLP 融合模型，将时序数据建模为微分动力系统，通过 RNN 和 Neural ODE 模型构建变分自编码层（VAE 层），利用 RNN 进行时序数据的压缩和降维，再将神经微分方程（Neural ODE）学习时序数据隐含的时序演化规律，将数据进行重构，最后我们将重构去噪后的数据输入 MLP 模型进行 alpha 信息的捕捉和挖掘，从而提升模型样本外的选股鲁棒性。

通过将 Baseline 模型和新模型因子多头绩效的对比，我们得到以下结论： 1. 相较于 Baseline 模型，除 2020 年和今年，其余各年份 Model1 因子的多头超额均能大幅跑赢。而分组超额来看，Model1的 Top 组和 Grp1 组超额相较于 Baseline 模型分别提升了 1.91% 和 3.07%，说明新模型相对于 Baseline 能大幅改善多头的表现。 2. 在 2024 年出现较为极端的市场环境下，Model1 因子多头超额相较于 Baseline 模型提升了 6.63%，最大回撤也有所下降，说明 Model1 抗风险能力相对更强。 3. 在各个回测区间，Model1 因子的多头组合换手率相较于 Baseline 均有一定程度的下降。这意味着实盘可能有更高的交易成本优势。 4. Baseline 模型和 Model1 模型多头超额净值走势趋同度较高，各年度的最大回撤区间基本上重合，说明各类模型从相同量价特征中提取的 alpha 信息一致性相对较高。新模型 2018 年以来在中证全指上十日 RankIC 均值为 16.33%，top 组年化超额分别为 54.54%。相较于基准，新模型选股效果均有明显提升。行业轮动方面，2018 年以来，新模型 RankIC 可达 12.55%，Top 组年化超额可达 25.27%，各项指标表现也显著战胜基准。本文生成因子也可以直接应用于指数增强策略，在各宽基指数上均能获得显著的超额收益，在成分股不低于 80%限制、周单边换手率为 20%约束下，在沪深 300、中证 500 和中证 1000 增强策略上 2018 年以来新模型年化超额收益率分别为 16.67%，21.37%和 32.41%，超额的夏普比率分别为 3.14、3.21、4.37。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）