2025年金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子
- 来源:国海证券
- 发布时间:2025/09/15
- 浏览次数:123
- 举报
金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子.pdf
金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子。多维度特征输入,丰富模型信息。为提升因子预测能力,本报告构建了涵盖6大一级类别、128个特征的输入体系,覆盖基础收益率(如日内收益率、隔夜收益率)、Barra风格因子(如对数市值、贝塔、动量)、基础量价因子(如换手率、波动率)、基本面因子(估值、盈利能力、成长能力等)、高频因子(分钟级成交额自相关性、Level2主动买卖占比等)及技术指标(MACD、RSI、布林带等)。丰富的特征结构能够充分捕捉市场的多维信息,降低特征不足可能带来的欠拟合风险。多模式GRU模型池设计,平衡预测精度与效率。选用GRU作为基础架构,并在此基础上构建了4类...
1、模型池结构
我们选择 GRU 作为基础模型,是基于其较强的时序数据建模与预测能力。在A股市场的深度学习多因子模型研究中,在未进行精细化调参且输入时间步较短的情形下,一些新颖模型的预测表现可能不及 GRU。GRU 作为基础模型,简单的参数设计即可取得较优的预测效果。叠加其他模块,可使预测结果稍有区别,对最终的集成因子有贡献。我们将4 个以GRU为主体的模型用于训练,模型结构如图 1: GRU:采用基础的 GRU 架构,包含双层 GRU,每层含32 个神经元,并在层间设置 0.2 的 Dropout 以防止过拟合。GRU 层的输出首先输入至一层(32,16)的全连接层并经过 ReLU 激活,随后通过(16,1)的全连接层生成最终预测结果。 AttentionGRU:在双层 GRU 后加入 4 个注意力头的多头自注意力机制,并行学习特征间的相关性与权重分布,捕捉特征重要性,再经全连接层完成预测输出。
PatchGRU:基于“切片”思想,将原始时间序列按照预设的时间窗口长度和步长进行切分,并分别输入至基础 GRU 模型进行特征提取。具体而言,当输入特征时间步为 30、时间窗口为 10、切片步长为 5 时,可生成6 个时间片段;每个片段经过 GRU 网络后,提取其最后一个时间步的隐藏状态,拼接后再送入一个新的 GRU 进行学习,以捕捉长时间尺度的依赖关系。由于每个GRU层处理的最长时间步仅为 10,远低于基础模型的 30 步,这不仅保留了时序特征建模能力,同时显著降低了显存占用。 FFTGRU:同时利用时间域与频率域的特征表示,提升对时序信号多尺度模式的建模能力。输入特征首先经双层 GRU 提取时间域的依赖特征A,再通过快速傅里叶变换(Fast Fourier Transform, FFT)将原始序列投影到频率域,保留实部与虚部并在特征维度上拼接后,输入另一组结构对称的双层GRU,以捕捉频谱模式及其相位信息 B。随后,将时间域 A 和频率域B 的最终隐藏状态(各32维)拼接成 64 维向量,出首先输入至一层(64,32)的全连接层并经过ReLU激活,随后通过(32,1)的全连接层生成最终预测结果。相比仅在时间域处理的传统GRU,该方法能够在有限的时间步信息下同时学习时序的趋向性与周期性特征,以期提升对复杂非平稳序列的建模能力。
2、训练参数设计
2.1、数据集
在多因子深度学习模型中,输入特征的质量往往是影响预测效果的最关键因素。若仅使用简单的原始日频量价特征,由于近年来市场的结构性变化以及深度学习类策略的普及与拥挤效应,此类特征所训练得到的因子容易失效。另一方面,若仅依赖单一类别的特征,则可能导致模型欠拟合,无法捕捉更丰富的市场信息。无论模型结构多么优秀,若数据输入部分存在不足,最终因子的Alpha获取能力都会受到明显限制。 为达到理想的预测效果,我们使用丰富类别的日频输入特征,涵盖6大一级类别、128 个特征的数据集。覆盖基础收益率(如日内收益率、隔夜收益率)、Barra风格因子(如对数市值、贝塔、动量)、基础量价因子(如换手率、波动率)、基本面因子(估值、盈利能力、成长能力等)、高频因子(分钟级成交额自相关性、Level2 主动买卖占比等)及技术指标(MACD、RSI、布林带等)。全部特征均可通过国海金工数据库实现增量更新,确保模型的可复现性。2012-2025.08.22,将输入特征按 dict 格式、每个交易日保存一个“.pkl”格式文件,滚动过去 30 个交易日、128 个特征、每个交易日可交易的股票数量计算,文件大小总共约 300GB。
对于预测目标,使用相同的模型、相同的输入特征,但分为两个不同的预测目标:VWAP T1-T21 的涨跌幅、VWAP T1-T21 的夏普比率(涨跌幅/标准差)。前者意味着值的大小严格按涨跌幅排序;后者则考虑了股票波动的因素,涨幅大的同时,波动小的股票才会排名较为靠前。 后文实证结果证明,使用夏普比率作为预测目标的深度学习因子ICIR和IC胜率较优;使用涨跌幅的深度学习因子 RankIC 更优。二者深度学习因子等权合成后,会中和 ICIR 表现、进一步获得更优的 RankIC。
2.2、参数设计
2.2.1、训练回顾周期
A 股历史往往呈现明显的风格变动。

其中,市值风格在 2021 下半年至 2024 年初呈现明显的小市值风格占优特征,2024 年初短时间转向大市值风格;计算机行业则在2023 年和2025年初因ChatGPT、DeepSeek 概念带火行情。风格和行业的均出现明显的偏离,切换的周期呈现几年为一个尺度的特性。 因此,回顾过去多少期限的样本点,往往会影响深度学习模型拟合的风格特性,影响测试集的预测效果。我们从集成的思路出发,完全可以训练多个模型,分别覆盖不同历史周期的样本,学习短、中、长期和全历史的风格动量信息,得到更综合、稳健的选股因子: 短期:过去 2 年的样本,1.5 年训练,6 个月验证,每2 个月滚动更新一次模型;中期:过去 4 年的样本,3 年训练,1 年验证,每4 个月滚动更新一次模型;长期:过去 6 年的样本,4.5 年训练,1.5 年验证,每6 个月滚动更新一次模型;全历史:有数据以来作为样本,除最后 2 年以外训练,2 年验证,每年滚动更新一次模型。 后文的实证结果表明,四者训练因子的表现不尽相同,等权合成后的因子会取得更优的表现。
3、因子表现
3.1、单因子表现
分别训练 4 个回顾周期、4 个模型、2 个预测目标,得到32 个因子。统计因子的 RankIC、ICIR、IC 胜率,RankIC 依据 VWAP T1-T21 间收益率计算,ICIR未做年化处理。 单因子 RankIC 集中在 0.16 左右的区间,模型间、训练回顾周期间差异不大。收益率作为预测目标对比夏普比率作为预测目标,RankIC稍好,但ICIR、IC胜率较弱。即更容易学习到股票间相对排名,但稳定性欠佳。
3.2、合成因子表现
基于 32 个 GRU 单因子,统计分别按训练周期(4 个)、模型(4个)、预测目标(2 个)等权合成,以及最终的合成因子(1 个)。
4 个不同训练回顾周期合成因子的 RankIC 和最终合成因子差异最大,4个不同模型、2 个不同预测目标合成因子和最终合成因子的RankIC差异很小。预测目标为 IRCSRankCSZscore 方式训练的因子,其ICIR 和IC胜率明显优于CSRankCSZscore。

多空超额来看,最终合成因子并非表现最好。CSRankCSZscore 模型在沪深300、中证 500 上表现最好,PatchGRU 模型在中证1000、万得全A上展现更强的选股能力;训练回顾周期为 6Y 的模型表现最弱。其中,最终合成因子在沪深300、中证 500、中证 A500、中证 1000 和万得全 A 成分股内的10 分组多空年化收益率分别为 48.1%、51.6%、74.4%和 88.4%。
3.3、相关性测试
基于 32 个 GRU 单因子,统计分别按训练周期(4 个)、模型(4个)、预测目标(2 个)等权合成,以及最终的合成因子(1 个)。
可见,不同训练回顾周期间因子相关性最低,如2Y 与全历史间相关性仅0.7;不同 GRU 属性模型间相关性在 0.9 以上。两种处理预测目标方式的因子相关性为 0.95。最终合成因子与各模型合成因子、两种预测目标合成因子相关性极高,与其他合成因子的相关性均在 0.9 以上。 因此,不同的滚动训练的回顾周期所提供的差异性信息明显多于不同模型的拟合信息、改变预测目标的信息。
4、指数增强表现
我们基于融合因子构建沪深 300、中证 500、中证A500 和中证1000指数增强策略。组合优化的目标函数为最大化扣费后超额收益率,调仓频率为双周。其中,交易费用设为双边千分之三,按次日 VWAP 成交,剔除次新、ST、涨停、不交易的股票。 对于 300 指增,我们认为采用较为严格的风险约束、获取更好的收益风险比较为重要。例如严格限制跟踪误差,追求较好的信息比率,具体的标准如下:1)10 个 CNE5 Barra 风格因子的偏离绝对值≤0.1 倍标准差;2)成分股权重之和≥90%; 3)2021 年 8 月开始,控制双创板块成分股权重中性;4)个股权重偏离绝对值≤1%; 5)中信一级行业权重偏离绝对值≤1%;6)跟踪误差≤2.5%。
对于 500 和 1000 指增,我们认为在控制一定的风险前提下,主要任务是获取多头超额收益,具体的标准如下: 1)CNE5 Barra 风格因子的偏离绝对值≤0.5 倍标准差;2)成分股权重之和≥80%; 3)2021 年 8 月开始,控制双创板块成分股权重中性;4)500 指增个股权重偏离绝对值≤0.8%,1000 指增≤0.5%;5)中信一级行业权重偏离绝对值≤1%;6)单边换手≤25%。
4.1、沪深 300 指数增强策略
2015-2025.08.22,策略年化超额收益率为 7.7%,跟踪误差仅2.4%,信息比率达 3.24;累计超额收益率的最大回撤 3%,超额卡玛比率2.56。除2019年、2021年外,2014-2024 年每年的超额收益率都在 5%及以上。2024 年超额收益率为5.8%,跟踪误差 2.8%,最大回撤仅 2.4%。2025YTD 超额收益率为2.4%,跟踪误差 2%,最大回撤 1.2%。
策略年均单边换手率 2.5 倍,2022 年以来逐年下降,2024 年不足2倍。总体而言,策略在较低的换手率和跟踪误差之下,能够较为稳定地实现相对沪深300价格指数较稳定的超额收益率。
4.2、中证 500 指数增强策略
2015-2025.08.22,策略年化超额收益率为 15.4%,跟踪误差为6.7%,信息比率为 2.3;累计超额收益率的最大回撤 9.1%,超额卡玛比率1.68,策略年均单边换手率 7.08 倍。2025 年 YTD,策略超额收益率4.9%,跟踪误差6.6%,超额最大回撤 3.5%。

2017、2019、2021 年,策略未达到两位数超额收益率;2024、2025年,策略超额收益率大幅下降。我们认为,传统的深度学习因子或在中证500上选股已经大幅失效,中证 500 成分股中一些周期、成长股过于不平衡的波动,近年来较持久的展现非低波、非低流动性的风格特性。
4.3、中证 1000 指数增强策略
2015-2025.08.22,策略年化超额收益率为 20.9%,跟踪误差为6.9%,信息比率为 3.03;累计超额收益率的最大回撤 10.1%,超额卡玛比率2.08。2025年YTD,策略超额收益率 9.4%,跟踪误差 7.5%,超额最大回撤3.9%。
2023 年及以前,策略能保持双位数超额收益率;2024 年,策略超额收益率下降到个位数。2025 年小市值风格贡献大于低波动、低流动性风格。
我们认为,传统的深度学习方法不适合当前慢牛市的节奏,震荡市、熊市获取超额收益的能力较稳定,高波动、风格或行业偏离较严重的市场环境需要对因子的使用有较严的风控限制。
5、总结
特征输入端,我们使用丰富类别的各类输入特征,包括基础的收益率、Barra风格因子、基础量价因子和技术指标,还有基本面、估值类因子,以及基于分钟频和 Level2 构建的高频因子,拼凑了 128 个特征投喂给深度学习模型。训练端,使用 4 个训练回顾周期、4 个模型、2 个预测目标,得到32个GRU单因子,构建了一个综合表现更强的合成因子。其中,预测目标为 CSRankCSZscore 方法的 RankIC 较优,IRCSRankCSZscore方法的 ICIR 和 IC 胜率较优。CSRankCSZscore 方法在沪深300、中证500上多空收益表现较好,PatchGRU 模型在中证 1000、万得全A上多空收益表现较好。
2015-2025.08.22,合成因子 VWAP T1-T21 达到RankIC 为0.176,ICIR为1.342,IC 胜率 92.5%,在沪深 300、中证 500、中证1000 和万得全A成分股内的10分组多空年化收益率分别为 48.1%、51.6%、74.4%和88.4%。使用改进后的深度学习因子,在较为严格的风险约束条件和组合优化参数下,沪深 300 指数增强策略仍能实现较好的收益风险比,其中,控制指数双创板块成分股权重中性后,策略的跟踪误差和超额最大回撤有一定改善。沪深 300 指增策略长期年化超额收益率为 7.7%,跟踪误差2.4%,信息比率3.24;累计超额收益率的最大回撤 3%,超额卡玛比率2.56。除2019 年、2021年外,2015-2024 每年的超额收益率都在 5%及以上。2024 年超额收益率为5.8%,跟踪误差 2.8%,最大回撤仅 2.4%。2025YTD 超额收益率为2.4%,跟踪误差2%,最大回撤 1.2%。中证 500、中证 1000 指增策略长期年化超额分别为15.4%和20.9%,跟踪误差分别为 6.7%和 6.9%,2025YTD 超额收益分别为4.9%和9.4%。本篇报告仍有不足。第一,特征输入端仅使用日频因子,尚未加入原始的分钟频数据或将 Level2 压缩为分钟频特征,这类信息还可以提供增量的Alpha,有助因子表现更佳。第二,模型端仅考虑标准形式的GRU 预测模型,未考虑股票间关联信息,或可通过加入元学习、组合优化等方法来增强模型抗风险能力。第三,因子合成方法为等权合成,亦有 IC 加权、半衰期加权或机器学习训练等非线性合成方式。第四,2024 年以来,传统深度学习方法因子出现阶段性失效现象,主要由于若干时间段内,高波、高流动性、低BP、低EP 股票显著跑赢市场,深度学习选股策略容易出现持续回撤。长期以来这类风格并不占优,这考验着投资者使用深度学习选股策略的耐力。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf
- 科技制造行业产业月报(26年2月):灵巧之手,如何成形?——解析人形机器人灵巧手产业链.pdf
- 克莱尔:一种用于韧性估计的因果机器学习方法(英译中).pdf
- 机器学习系列之一:mHC对Barra机器学习因子的改进.pdf
- 机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf
- 基于可微RankIC损失函数的深度学习选股策略——机器学习选股系列研究之一.pdf
- 机器学习应用系列专题报告:DAFAT,基于Transformer模型的自适应解决方案.pdf
- 人工智能和机器学习系列专题研究:基于动量Transformer模型的日内和隔夜交易策略.pdf
- 2025年人工智能与机器学习在医疗科技领域的崛起研究报告(英文版).pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 机器人行业深度研究报告:机器人产业体系综合分析.pdf
- 2 人形机器人行业研究:产业前景广阔,看好核心零部件.pdf
- 3 ChatGPT专题报告:又一个“人形机器人”主题.pdf
- 4 扫地机器人行业研究之产品篇:基于“进化”模型探索扫地机必选可选功能未来,降本助力价格下探实现行业放量.pdf
- 5 人形机器人供应链梳理专题报告.pdf
- 6 工业机器视觉行业深度报告:兼具高成长和成熟技术的AI应用赛道.pdf
- 7 灵巧手行业研究报告:机器人新型末端执行器,国内外研究进展加速.pdf
- 8 3D工业视觉行业研究:机器人的眼睛.pdf
- 9 机器人行业深度研究报告:机器人行业展望,四大逻辑利好机器人产业链发展.pdf
- 10 手术机器人行业深度研究:国产手术机器人进入商业化时代.pdf
- 1 三友医疗研究报告:脊柱集采出清,全球化布局脊柱机器人+超声骨刀.pdf
- 2 摩根士丹利-全球科技行业:人形机器人技术——把握未来.pdf
- 3 人形机器人灵巧手行业深度报告:百花齐放,进化不止.pdf
- 4 两会“爆款”主题面面观,兼论深海科技与具身智能(人形机器人)的投资前景.pdf
- 5 美世2024-2025全球人才趋势报告:员工队伍2.0-在机器增强的世界中释放员工潜力.pdf
- 6 九号公司研究报告:智能短交通及服务类机器人领军企业,多元新业务持续成长.pdf
- 7 人形机器人行业分析:三阶段投资框架,人形机器人行至何处.pdf
- 8 人工智能和机器学习系列专题研究:基于动量Transformer模型的日内和隔夜交易策略.pdf
- 9 电子皮肤行业深度报告:实现机器柔性触觉,感知世界触手可及.pdf
- 10 大鹏工业研究报告:工业精密清洗装备小巨人企业,加速布局机器视觉检测产品.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架
- 2 2026年科技制造行业产业月报(26年2月):灵巧之手,如何成形?——解析人形机器人灵巧手产业链
- 3 2026年基于风格因子的非线性分域训练研究—机器学习系列九
- 4 2026年量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探
- 5 2026年泳池清洁机器人行业深度:蓝海扬帆,破局而立
- 6 2026年机器学习系列之一:mHC对Barra机器学习因子的改进
- 7 2025年第53周机械行业月报:人形机器人有望成为美国科技战略主线,建议持续关注人形机器人、AIDC配套设备
- 8 2025年车企加速布局具身智能,推动汽车与机器人产业双向奔赴
- 9 2025年电子皮肤行业深度报告:实现机器柔性触觉,感知世界触手可及
- 10 2025年大鹏工业研究报告:工业清洗隐形冠军,机器视觉打造强劲第二增长曲线
- 1 2026年机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架
- 2 2026年科技制造行业产业月报(26年2月):灵巧之手,如何成形?——解析人形机器人灵巧手产业链
- 3 2026年基于风格因子的非线性分域训练研究—机器学习系列九
- 4 2026年量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探
- 5 2026年泳池清洁机器人行业深度:蓝海扬帆,破局而立
- 6 2026年机器学习系列之一:mHC对Barra机器学习因子的改进
- 7 2025年第53周机械行业月报:人形机器人有望成为美国科技战略主线,建议持续关注人形机器人、AIDC配套设备
- 8 2025年车企加速布局具身智能,推动汽车与机器人产业双向奔赴
- 9 2025年电子皮肤行业深度报告:实现机器柔性触觉,感知世界触手可及
- 10 2025年大鹏工业研究报告:工业清洗隐形冠军,机器视觉打造强劲第二增长曲线
- 1 2026年机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架
- 2 2026年科技制造行业产业月报(26年2月):灵巧之手,如何成形?——解析人形机器人灵巧手产业链
- 3 2026年基于风格因子的非线性分域训练研究—机器学习系列九
- 4 2026年量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探
- 5 2026年泳池清洁机器人行业深度:蓝海扬帆,破局而立
- 6 2026年机器学习系列之一:mHC对Barra机器学习因子的改进
- 7 2025年第53周机械行业月报:人形机器人有望成为美国科技战略主线,建议持续关注人形机器人、AIDC配套设备
- 8 2025年车企加速布局具身智能,推动汽车与机器人产业双向奔赴
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
