2025年金工机器学习系列专题报告：多模式合成的GRU深度学习选股因子

来源：国海证券
发布时间：2025/09/15
浏览次数：122
举报

相关深度报告REPORTS

金工机器学习系列专题报告：多模式合成的GRU深度学习选股因子.pdf

金工机器学习系列专题报告：多模式合成的GRU深度学习选股因子。多维度特征输入，丰富模型信息。为提升因子预测能力，本报告构建了涵盖6大一级类别、128个特征的输入体系，覆盖基础收益率（如日内收益率、隔夜收益率）、Barra风格因子（如对数市值、贝塔、动量）、基础量价因子（如换手率、波动率）、基本面因子（估值、盈利能力、成长能力等）、高频因子（分钟级成交额自相关性、Level2主动买卖占比等）及技术指标（MACD、RSI、布林带等）。丰富的特征结构能够充分捕捉市场的多维信息，降低特征不足可能带来的欠拟合风险。多模式GRU模型池设计，平衡预测精度与效率。选用GRU作为基础架构，并在此基础上构建了4类...

1、模型池结构

我们选择 GRU 作为基础模型，是基于其较强的时序数据建模与预测能力。在A股市场的深度学习多因子模型研究中，在未进行精细化调参且输入时间步较短的情形下，一些新颖模型的预测表现可能不及 GRU。GRU 作为基础模型，简单的参数设计即可取得较优的预测效果。叠加其他模块，可使预测结果稍有区别，对最终的集成因子有贡献。我们将4 个以GRU为主体的模型用于训练，模型结构如图 1： GRU：采用基础的 GRU 架构，包含双层 GRU，每层含32 个神经元，并在层间设置 0.2 的 Dropout 以防止过拟合。GRU 层的输出首先输入至一层（32，16）的全连接层并经过 ReLU 激活，随后通过（16，1）的全连接层生成最终预测结果。 AttentionGRU：在双层 GRU 后加入 4 个注意力头的多头自注意力机制，并行学习特征间的相关性与权重分布，捕捉特征重要性，再经全连接层完成预测输出。

PatchGRU：基于“切片”思想，将原始时间序列按照预设的时间窗口长度和步长进行切分，并分别输入至基础 GRU 模型进行特征提取。具体而言，当输入特征时间步为 30、时间窗口为 10、切片步长为 5 时，可生成6 个时间片段；每个片段经过 GRU 网络后，提取其最后一个时间步的隐藏状态，拼接后再送入一个新的 GRU 进行学习，以捕捉长时间尺度的依赖关系。由于每个GRU层处理的最长时间步仅为 10，远低于基础模型的 30 步，这不仅保留了时序特征建模能力，同时显著降低了显存占用。 FFTGRU：同时利用时间域与频率域的特征表示，提升对时序信号多尺度模式的建模能力。输入特征首先经双层 GRU 提取时间域的依赖特征A，再通过快速傅里叶变换（Fast Fourier Transform, FFT）将原始序列投影到频率域，保留实部与虚部并在特征维度上拼接后，输入另一组结构对称的双层GRU，以捕捉频谱模式及其相位信息 B。随后，将时间域 A 和频率域B 的最终隐藏状态（各32维）拼接成 64 维向量，出首先输入至一层（64，32）的全连接层并经过ReLU激活，随后通过（32，1）的全连接层生成最终预测结果。相比仅在时间域处理的传统GRU，该方法能够在有限的时间步信息下同时学习时序的趋向性与周期性特征，以期提升对复杂非平稳序列的建模能力。

2、训练参数设计

2.1、数据集

在多因子深度学习模型中，输入特征的质量往往是影响预测效果的最关键因素。若仅使用简单的原始日频量价特征，由于近年来市场的结构性变化以及深度学习类策略的普及与拥挤效应，此类特征所训练得到的因子容易失效。另一方面，若仅依赖单一类别的特征，则可能导致模型欠拟合，无法捕捉更丰富的市场信息。无论模型结构多么优秀，若数据输入部分存在不足，最终因子的Alpha获取能力都会受到明显限制。为达到理想的预测效果，我们使用丰富类别的日频输入特征，涵盖6大一级类别、128 个特征的数据集。覆盖基础收益率（如日内收益率、隔夜收益率）、Barra风格因子（如对数市值、贝塔、动量）、基础量价因子（如换手率、波动率）、基本面因子（估值、盈利能力、成长能力等）、高频因子（分钟级成交额自相关性、Level2 主动买卖占比等）及技术指标（MACD、RSI、布林带等）。全部特征均可通过国海金工数据库实现增量更新，确保模型的可复现性。2012-2025.08.22，将输入特征按 dict 格式、每个交易日保存一个“.pkl”格式文件，滚动过去 30 个交易日、128 个特征、每个交易日可交易的股票数量计算，文件大小总共约 300GB。

对于预测目标，使用相同的模型、相同的输入特征，但分为两个不同的预测目标：VWAP T1-T21 的涨跌幅、VWAP T1-T21 的夏普比率（涨跌幅/标准差）。前者意味着值的大小严格按涨跌幅排序；后者则考虑了股票波动的因素，涨幅大的同时，波动小的股票才会排名较为靠前。后文实证结果证明，使用夏普比率作为预测目标的深度学习因子ICIR和IC胜率较优；使用涨跌幅的深度学习因子 RankIC 更优。二者深度学习因子等权合成后，会中和 ICIR 表现、进一步获得更优的 RankIC。

2.2、参数设计

2.2.1、训练回顾周期

A 股历史往往呈现明显的风格变动。

其中，市值风格在 2021 下半年至 2024 年初呈现明显的小市值风格占优特征，2024 年初短时间转向大市值风格；计算机行业则在2023 年和2025年初因ChatGPT、DeepSeek 概念带火行情。风格和行业的均出现明显的偏离，切换的周期呈现几年为一个尺度的特性。因此，回顾过去多少期限的样本点，往往会影响深度学习模型拟合的风格特性，影响测试集的预测效果。我们从集成的思路出发，完全可以训练多个模型，分别覆盖不同历史周期的样本，学习短、中、长期和全历史的风格动量信息，得到更综合、稳健的选股因子：短期：过去 2 年的样本，1.5 年训练，6 个月验证，每2 个月滚动更新一次模型；中期：过去 4 年的样本，3 年训练，1 年验证，每4 个月滚动更新一次模型；长期：过去 6 年的样本，4.5 年训练，1.5 年验证，每6 个月滚动更新一次模型；全历史：有数据以来作为样本，除最后 2 年以外训练，2 年验证，每年滚动更新一次模型。后文的实证结果表明，四者训练因子的表现不尽相同，等权合成后的因子会取得更优的表现。

3、因子表现

3.1、单因子表现

分别训练 4 个回顾周期、4 个模型、2 个预测目标，得到32 个因子。统计因子的 RankIC、ICIR、IC 胜率，RankIC 依据 VWAP T1-T21 间收益率计算，ICIR未做年化处理。单因子 RankIC 集中在 0.16 左右的区间，模型间、训练回顾周期间差异不大。收益率作为预测目标对比夏普比率作为预测目标，RankIC稍好，但ICIR、IC胜率较弱。即更容易学习到股票间相对排名，但稳定性欠佳。

3.2、合成因子表现

基于 32 个 GRU 单因子，统计分别按训练周期（4 个）、模型（4个）、预测目标（2 个）等权合成，以及最终的合成因子（1 个）。

4 个不同训练回顾周期合成因子的 RankIC 和最终合成因子差异最大，4个不同模型、2 个不同预测目标合成因子和最终合成因子的RankIC差异很小。预测目标为 IRCSRankCSZscore 方式训练的因子，其ICIR 和IC胜率明显优于CSRankCSZscore。

多空超额来看，最终合成因子并非表现最好。CSRankCSZscore 模型在沪深300、中证 500 上表现最好，PatchGRU 模型在中证1000、万得全A上展现更强的选股能力；训练回顾周期为 6Y 的模型表现最弱。其中，最终合成因子在沪深300、中证 500、中证 A500、中证 1000 和万得全 A 成分股内的10 分组多空年化收益率分别为 48.1%、51.6%、74.4%和 88.4%。

3.3、相关性测试

基于 32 个 GRU 单因子，统计分别按训练周期（4 个）、模型（4个）、预测目标（2 个）等权合成，以及最终的合成因子（1 个）。

可见，不同训练回顾周期间因子相关性最低，如2Y 与全历史间相关性仅0.7；不同 GRU 属性模型间相关性在 0.9 以上。两种处理预测目标方式的因子相关性为 0.95。最终合成因子与各模型合成因子、两种预测目标合成因子相关性极高，与其他合成因子的相关性均在 0.9 以上。因此，不同的滚动训练的回顾周期所提供的差异性信息明显多于不同模型的拟合信息、改变预测目标的信息。

4、指数增强表现

我们基于融合因子构建沪深 300、中证 500、中证A500 和中证1000指数增强策略。组合优化的目标函数为最大化扣费后超额收益率，调仓频率为双周。其中，交易费用设为双边千分之三，按次日 VWAP 成交，剔除次新、ST、涨停、不交易的股票。对于 300 指增，我们认为采用较为严格的风险约束、获取更好的收益风险比较为重要。例如严格限制跟踪误差，追求较好的信息比率，具体的标准如下：1）10 个 CNE5 Barra 风格因子的偏离绝对值≤0.1 倍标准差；2）成分股权重之和≥90%； 3）2021 年 8 月开始，控制双创板块成分股权重中性；4）个股权重偏离绝对值≤1%； 5）中信一级行业权重偏离绝对值≤1%；6）跟踪误差≤2.5%。

对于 500 和 1000 指增，我们认为在控制一定的风险前提下，主要任务是获取多头超额收益，具体的标准如下： 1）CNE5 Barra 风格因子的偏离绝对值≤0.5 倍标准差；2）成分股权重之和≥80%； 3）2021 年 8 月开始，控制双创板块成分股权重中性；4）500 指增个股权重偏离绝对值≤0.8%，1000 指增≤0.5%；5）中信一级行业权重偏离绝对值≤1%；6）单边换手≤25%。

4.1、沪深 300 指数增强策略

2015-2025.08.22，策略年化超额收益率为 7.7%，跟踪误差仅2.4%，信息比率达 3.24；累计超额收益率的最大回撤 3%，超额卡玛比率2.56。除2019年、2021年外，2014-2024 年每年的超额收益率都在 5%及以上。2024 年超额收益率为5.8%，跟踪误差 2.8%，最大回撤仅 2.4%。2025YTD 超额收益率为2.4%，跟踪误差 2%，最大回撤 1.2%。

策略年均单边换手率 2.5 倍，2022 年以来逐年下降，2024 年不足2倍。总体而言，策略在较低的换手率和跟踪误差之下，能够较为稳定地实现相对沪深300价格指数较稳定的超额收益率。

4.2、中证 500 指数增强策略

2015-2025.08.22，策略年化超额收益率为 15.4%，跟踪误差为6.7%，信息比率为 2.3；累计超额收益率的最大回撤 9.1%，超额卡玛比率1.68，策略年均单边换手率 7.08 倍。2025 年 YTD，策略超额收益率4.9%，跟踪误差6.6%，超额最大回撤 3.5%。

2017、2019、2021 年，策略未达到两位数超额收益率；2024、2025年，策略超额收益率大幅下降。我们认为，传统的深度学习因子或在中证500上选股已经大幅失效，中证 500 成分股中一些周期、成长股过于不平衡的波动，近年来较持久的展现非低波、非低流动性的风格特性。

4.3、中证 1000 指数增强策略

2015-2025.08.22，策略年化超额收益率为 20.9%，跟踪误差为6.9%，信息比率为 3.03；累计超额收益率的最大回撤 10.1%，超额卡玛比率2.08。2025年YTD，策略超额收益率 9.4%，跟踪误差 7.5%，超额最大回撤3.9%。

2023 年及以前，策略能保持双位数超额收益率；2024 年，策略超额收益率下降到个位数。2025 年小市值风格贡献大于低波动、低流动性风格。

我们认为，传统的深度学习方法不适合当前慢牛市的节奏，震荡市、熊市获取超额收益的能力较稳定，高波动、风格或行业偏离较严重的市场环境需要对因子的使用有较严的风控限制。

5、总结

特征输入端，我们使用丰富类别的各类输入特征，包括基础的收益率、Barra风格因子、基础量价因子和技术指标，还有基本面、估值类因子，以及基于分钟频和 Level2 构建的高频因子，拼凑了 128 个特征投喂给深度学习模型。训练端，使用 4 个训练回顾周期、4 个模型、2 个预测目标，得到32个GRU单因子，构建了一个综合表现更强的合成因子。其中，预测目标为 CSRankCSZscore 方法的 RankIC 较优，IRCSRankCSZscore方法的 ICIR 和 IC 胜率较优。CSRankCSZscore 方法在沪深300、中证500上多空收益表现较好，PatchGRU 模型在中证 1000、万得全A上多空收益表现较好。

2015-2025.08.22，合成因子 VWAP T1-T21 达到RankIC 为0.176，ICIR为1.342，IC 胜率 92.5%，在沪深 300、中证 500、中证1000 和万得全A成分股内的10分组多空年化收益率分别为 48.1%、51.6%、74.4%和88.4%。使用改进后的深度学习因子，在较为严格的风险约束条件和组合优化参数下，沪深 300 指数增强策略仍能实现较好的收益风险比，其中，控制指数双创板块成分股权重中性后，策略的跟踪误差和超额最大回撤有一定改善。沪深 300 指增策略长期年化超额收益率为 7.7%，跟踪误差2.4%，信息比率3.24；累计超额收益率的最大回撤 3%，超额卡玛比率2.56。除2019 年、2021年外，2015-2024 每年的超额收益率都在 5%及以上。2024 年超额收益率为5.8%，跟踪误差 2.8%，最大回撤仅 2.4%。2025YTD 超额收益率为2.4%，跟踪误差2%，最大回撤 1.2%。中证 500、中证 1000 指增策略长期年化超额分别为15.4%和20.9%，跟踪误差分别为 6.7%和 6.9%，2025YTD 超额收益分别为4.9%和9.4%。本篇报告仍有不足。第一，特征输入端仅使用日频因子，尚未加入原始的分钟频数据或将 Level2 压缩为分钟频特征，这类信息还可以提供增量的Alpha，有助因子表现更佳。第二，模型端仅考虑标准形式的GRU 预测模型，未考虑股票间关联信息，或可通过加入元学习、组合优化等方法来增强模型抗风险能力。第三，因子合成方法为等权合成，亦有 IC 加权、半衰期加权或机器学习训练等非线性合成方式。第四，2024 年以来，传统深度学习方法因子出现阶段性失效现象，主要由于若干时间段内，高波、高流动性、低BP、低EP 股票显著跑赢市场，深度学习选股策略容易出现持续回撤。长期以来这类风格并不占优，这考验着投资者使用深度学习选股策略的耐力。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）