2025年金融工程行业研究报告:结合基本面和量价特征的GRU模型

  • 来源:中邮证券
  • 发布时间:2025/06/06
  • 浏览次数:231
  • 举报
相关深度报告REPORTS

金融工程行业研究报告:结合基本面和量价特征的GRU模型.pdf

金融工程行业研究报告:结合基本面和量价特征的GRU模型。GRU模型用于量价信息挖掘的能力被广泛验证,本文通过构建中证1000超额组合的方式验证GRU模型对财务信息的挖掘能力。从结果上看,GRU模型可以同时结合量价信息与财务信息的挖掘,财务信息的高频化处理对模型结果有一定提升。模型最终表现受输入信息对预测目标的预测能力影响,财务信息对未来收益的预测能力在2022年之前较为显著,而2023年后纯量价模型表现更好,适量加入财务信息有助于改善GRU模型的稳定性。GRU模型基准基于股票过去240日行情训练的基准模型,模型构建的中证1000指数增强组合综合超额年化收益8.75%,信息比率2.25,超额最大...

1 GRU 模型现状

1.1 背景简述

近几年,GRU 模型运用于量化领域挖掘量价类信息的能力已经被广泛应用。 但是如何将财务信息结合到 GRU 模型仍然是一个正在探索的领域,常见的做法是 运用 GRU 神经网络构建量价模型再与现有的基本面模型结合。GRU 的量价模型和 基本面多因子模型一般来说相关性较低,所以这种结合方式比较容易接受。本文 想探讨直接将量价信息挖掘和基本面财务信息挖掘由一个 GRU 模型完成的方式。

1.2 基准模型设定

为了验证 GRU 神经网络具有同时挖掘量价信息和财务信息的能力,先设定一 个仅使用量价信息的 GRU 神经网络,在此基础上加入不同财务信息,观察模型表 现的变化来验证 GRU 是否从财务信息中挖掘到有用的信息。 考虑到大部分公募基金的换仓频率较低,基本面信息的更新频率也较低。所 以本文从较长回看周期的角度构建基准量价模型。 基准模型设置如下: 数据范围:20130101-20250430 全市场股票(不含北交所) 输入:每支股票每个月末一个样本,样本包含过去 240 个交易日的量价信 息,包含开盘价、最高价、最低价、收盘价、成交量、成交额和换手率 7 个字段, 每个字段做自身 240 个值的 z-score 标准化。 预测目标:截面标准化的次月收益率(月初的开盘价至月末的收盘价)。 训练集:过去 6 年的样本,按照时间顺序 4:1 划分训练集和验证集。 训练方式:每个月滚动训练,连续 10 轮训练损失函数未下降早停。

由于 GRU 神经网络是一类端到端的神经网络,从中间过程拆解不同信息的作 用较为困难,所以本文仅从结果上评价不同模型的表现。

1.3 基准模型表现

基准模型主要基于日行情信息构建,所以称之为日行情 GRU 因子。

多空表现计算方式:每月按照因子排序选取前 400 支股票作为多头组合,后 400 支作为空头组合,计算组合净值。

基于日行情训练的模型月度 IC 表现和多空收益走势整体稳定,月度 IC 基 本上显著为正,只有稀疏的几个月表现为负。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2022 年和 2023 年模型超额收益较强,2024 年和 2025 年有所减弱。综 合超额年化收益 8.75%,信息比率 2.25,超额最大回撤4.71%。

2 基本面信息引入

考虑到对未来收益的预测,本文主要引入的基本面信息来源于利润表中与公 司盈利能力较为相关的指标,例如营业收入、营业成本、管理费用、研发成本、 净利润等等以及市值信息,共计 20 个字段。

2.1 简单拼接财务信息

直接引入财务信息的方式,是将财务数据按照输入的每一个交易日最新可取 得的季报计算为 TTM 值然后拼接到新的列中。再将包含量价信息和基本面信息的 矩阵标准化处理后输入 GRU 网络中。

基于日行情和基本面训练的模型月度 IC 表现和多空收益走势整体稳定,月 度 IC 基本上显著为正,但是整体强度上略弱于日行情 GRU 模型。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额年化收 益 6.86%,信息比率 1.46,超额最大回撤 6.14%。

对比两个模型的表现,在 2022 年以前两个模型的超额收益表现相近,但是 2022 年以后引入基本面模型后的表现显著弱于日行情 GRU 模型。

简单引入财务信息存在不同信息频率不匹配的问题。行情数据每天都会变化, 更新频率较快,而财务信息的发布频率较低,在输入矩阵中,涉及财务指标的列 向量存在大量的重复数值,这对模型的训练存在一定影响。为了解决这个问题, 我们对财务指标进行合理调整,使其在每个交易日产生一定变化。

2.2 财务信息调整方式

基于日行情和调整基本面训练的模型月度 IC 表现和多空收益走势整体稳定, 月度 IC 基本上显著为正。

从中证 1000 增强组合上看,整体上超额收益较为稳定,除 2025 每年都取得 正的超额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额 年化收益 7.76%,信息比率 1.65,超额最大回撤 5.40%。

财务指标进行调整以后,模型的最终表现整体上有所增强,主要的增强来自 于 2022 年之前。与日行情 GRU 对比,加入调整基本面的 GRU 模型在 2022 年之 前显著强势,2023 年后显著弱势。

2.3 引入财务信息的影响

上文发现引入财务信息后,从模型表现上,可以发现 GRU 模型具有同时挖掘 日行情信息和基本面信息的能力。构建模型时本文选取了利润表中绝大数财务指 标,一方面多数财务指标的相关较高,不做筛选显得较为冗余。另一方面导致在 输入的数据中财务指标的向量要显著多于日行情,在 2023 年后基本面因子的表 现整体上要显著弱于技术因子,所以过多引入基本面信息会使得GRU模型在2023 年后显著变弱。

基于日行情和精选基本面训练的模型月度 IC 表现和多空收益走势整体稳定, 月度 IC 基本上显著为正。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额年化收 益 9.97%,信息比率 1.93,超额最大回撤 5.70%。

精简基本面因子后,模型的超额表现整体上得到一定提升,超额的年化收益 超过了日行情 GRU 模型。对比不同模型,一方面,可以发现引入基本面后主要能 提升 GRU 模型在 2022 年之前的表现,减弱 2023 年之后的表现,随着引入基本面 信息的增加,这种现象会更为显著。另一方面,引入的财务信息需要进行日频化 处理,简单的使用最新财务指标会使得引入的向量重复值过多,减弱模型的表现。

3 混频模型

上文研究的模型输入回看周期较长,模型的预测频率较低,与此前研究的基 于分钟数据的 GRU 模型存在一定差异,两者模型相关性较低。 Open1d:基于日内 240 分钟数据训练,预测未来 1 日 open to open 收益率 的 GRU 模型。 Close1d:基于日内 240 分钟数据训练,预测未来 1 日 close to close 收益 率的 GRU 模型。 Barra1d:基于日内 240 分钟数据训练,预测 barra 风格中性化后的未来 1 日 open to open 收益率的 GRU 模型。 Barra5d:基于日内 240 分钟数据训练,预测 barra 风格中性化后的未来 5 日 open to open 收益率的 GRU 模型。

3.1 分钟数据模型回顾

barra5d 模型虽然基于日行情训练,并且预测周期较短,但是在月度 IC 表 现和多空表现上并不弱,月度交易的中证1000超额组合也表现不错。不过在2024 年 10 月前后组合发生较大回撤,后续超额表现比较一般。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益。综合超额年化收益 8.84%,信息比率 1.99,超额最大回撤4.86%。

3.2 混频模型表现

barra5d+日行情模型的混频模型,结合了长期预测和短期预测的能力。IC 表 现和多空表现更为稳定。中证 1000 超额组合上看也显著修复了 barra5d 模型 2024 年 10 月后表现不佳的问题。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益。综合超额年化收益 11.32%,信息比率 2.42,超额最大回撤 8.19%。

3.3 基本面对混频模型的作用

引入基本面后 IC 表现和多空表现进一步提升。中证 1000 超额组合上看不 仅修复了 barra5d 模型 2024 年 10 月后表现不佳的问题,也解决了 barra5d+日 行情模型 21 年回撤较大的问题。每年的超额收益分布更为均匀。

从中证 1000 增强组合上看,整体上超额收益强势,每年都取得正向且稳定 的超额收益。综合超额年化收益 11.82%,信息比率 2.39,超额最大回撤 5.70%。

对比发现,barra5d 模型在加入日行情模型后显著提升了 2024 年下半年以 后的表现,再引入基本面信息可以使得超额收益在不同年份的分布更加稳定。

3.4 其他指数增强组合表现

选取主流的沪深 300 指数、中证 A500 指数、中证 500 指数以及科创综指, 使用 barra5d+日行情+精简基本面 GRU 因子构建指数增强组合,组合优化参数与 上文一致,仅改变基准。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至