2025年金融工程行业研究报告:结合基本面和量价特征的GRU模型
- 来源:中邮证券
- 发布时间:2025/06/06
- 浏览次数:231
- 举报
金融工程行业研究报告:结合基本面和量价特征的GRU模型.pdf
金融工程行业研究报告:结合基本面和量价特征的GRU模型。GRU模型用于量价信息挖掘的能力被广泛验证,本文通过构建中证1000超额组合的方式验证GRU模型对财务信息的挖掘能力。从结果上看,GRU模型可以同时结合量价信息与财务信息的挖掘,财务信息的高频化处理对模型结果有一定提升。模型最终表现受输入信息对预测目标的预测能力影响,财务信息对未来收益的预测能力在2022年之前较为显著,而2023年后纯量价模型表现更好,适量加入财务信息有助于改善GRU模型的稳定性。GRU模型基准基于股票过去240日行情训练的基准模型,模型构建的中证1000指数增强组合综合超额年化收益8.75%,信息比率2.25,超额最大...
1 GRU 模型现状
1.1 背景简述
近几年,GRU 模型运用于量化领域挖掘量价类信息的能力已经被广泛应用。 但是如何将财务信息结合到 GRU 模型仍然是一个正在探索的领域,常见的做法是 运用 GRU 神经网络构建量价模型再与现有的基本面模型结合。GRU 的量价模型和 基本面多因子模型一般来说相关性较低,所以这种结合方式比较容易接受。本文 想探讨直接将量价信息挖掘和基本面财务信息挖掘由一个 GRU 模型完成的方式。
1.2 基准模型设定
为了验证 GRU 神经网络具有同时挖掘量价信息和财务信息的能力,先设定一 个仅使用量价信息的 GRU 神经网络,在此基础上加入不同财务信息,观察模型表 现的变化来验证 GRU 是否从财务信息中挖掘到有用的信息。 考虑到大部分公募基金的换仓频率较低,基本面信息的更新频率也较低。所 以本文从较长回看周期的角度构建基准量价模型。 基准模型设置如下: 数据范围:20130101-20250430 全市场股票(不含北交所) 输入:每支股票每个月末一个样本,样本包含过去 240 个交易日的量价信 息,包含开盘价、最高价、最低价、收盘价、成交量、成交额和换手率 7 个字段, 每个字段做自身 240 个值的 z-score 标准化。 预测目标:截面标准化的次月收益率(月初的开盘价至月末的收盘价)。 训练集:过去 6 年的样本,按照时间顺序 4:1 划分训练集和验证集。 训练方式:每个月滚动训练,连续 10 轮训练损失函数未下降早停。

由于 GRU 神经网络是一类端到端的神经网络,从中间过程拆解不同信息的作 用较为困难,所以本文仅从结果上评价不同模型的表现。
1.3 基准模型表现
基准模型主要基于日行情信息构建,所以称之为日行情 GRU 因子。
多空表现计算方式:每月按照因子排序选取前 400 支股票作为多头组合,后 400 支作为空头组合,计算组合净值。

基于日行情训练的模型月度 IC 表现和多空收益走势整体稳定,月度 IC 基 本上显著为正,只有稀疏的几个月表现为负。
从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2022 年和 2023 年模型超额收益较强,2024 年和 2025 年有所减弱。综 合超额年化收益 8.75%,信息比率 2.25,超额最大回撤4.71%。
2 基本面信息引入
考虑到对未来收益的预测,本文主要引入的基本面信息来源于利润表中与公 司盈利能力较为相关的指标,例如营业收入、营业成本、管理费用、研发成本、 净利润等等以及市值信息,共计 20 个字段。
2.1 简单拼接财务信息
直接引入财务信息的方式,是将财务数据按照输入的每一个交易日最新可取 得的季报计算为 TTM 值然后拼接到新的列中。再将包含量价信息和基本面信息的 矩阵标准化处理后输入 GRU 网络中。
基于日行情和基本面训练的模型月度 IC 表现和多空收益走势整体稳定,月 度 IC 基本上显著为正,但是整体强度上略弱于日行情 GRU 模型。
从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额年化收 益 6.86%,信息比率 1.46,超额最大回撤 6.14%。
对比两个模型的表现,在 2022 年以前两个模型的超额收益表现相近,但是 2022 年以后引入基本面模型后的表现显著弱于日行情 GRU 模型。
简单引入财务信息存在不同信息频率不匹配的问题。行情数据每天都会变化, 更新频率较快,而财务信息的发布频率较低,在输入矩阵中,涉及财务指标的列 向量存在大量的重复数值,这对模型的训练存在一定影响。为了解决这个问题, 我们对财务指标进行合理调整,使其在每个交易日产生一定变化。
2.2 财务信息调整方式
基于日行情和调整基本面训练的模型月度 IC 表现和多空收益走势整体稳定, 月度 IC 基本上显著为正。
从中证 1000 增强组合上看,整体上超额收益较为稳定,除 2025 每年都取得 正的超额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额 年化收益 7.76%,信息比率 1.65,超额最大回撤 5.40%。
财务指标进行调整以后,模型的最终表现整体上有所增强,主要的增强来自 于 2022 年之前。与日行情 GRU 对比,加入调整基本面的 GRU 模型在 2022 年之 前显著强势,2023 年后显著弱势。
2.3 引入财务信息的影响
上文发现引入财务信息后,从模型表现上,可以发现 GRU 模型具有同时挖掘 日行情信息和基本面信息的能力。构建模型时本文选取了利润表中绝大数财务指 标,一方面多数财务指标的相关较高,不做筛选显得较为冗余。另一方面导致在 输入的数据中财务指标的向量要显著多于日行情,在 2023 年后基本面因子的表 现整体上要显著弱于技术因子,所以过多引入基本面信息会使得GRU模型在2023 年后显著变弱。
基于日行情和精选基本面训练的模型月度 IC 表现和多空收益走势整体稳定, 月度 IC 基本上显著为正。
从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益,2020-2022 年模型超额收益较强,2023 年后有所减弱。综合超额年化收 益 9.97%,信息比率 1.93,超额最大回撤 5.70%。
精简基本面因子后,模型的超额表现整体上得到一定提升,超额的年化收益 超过了日行情 GRU 模型。对比不同模型,一方面,可以发现引入基本面后主要能 提升 GRU 模型在 2022 年之前的表现,减弱 2023 年之后的表现,随着引入基本面 信息的增加,这种现象会更为显著。另一方面,引入的财务信息需要进行日频化 处理,简单的使用最新财务指标会使得引入的向量重复值过多,减弱模型的表现。
3 混频模型
上文研究的模型输入回看周期较长,模型的预测频率较低,与此前研究的基 于分钟数据的 GRU 模型存在一定差异,两者模型相关性较低。 Open1d:基于日内 240 分钟数据训练,预测未来 1 日 open to open 收益率 的 GRU 模型。 Close1d:基于日内 240 分钟数据训练,预测未来 1 日 close to close 收益 率的 GRU 模型。 Barra1d:基于日内 240 分钟数据训练,预测 barra 风格中性化后的未来 1 日 open to open 收益率的 GRU 模型。 Barra5d:基于日内 240 分钟数据训练,预测 barra 风格中性化后的未来 5 日 open to open 收益率的 GRU 模型。
3.1 分钟数据模型回顾
barra5d 模型虽然基于日行情训练,并且预测周期较短,但是在月度 IC 表 现和多空表现上并不弱,月度交易的中证1000超额组合也表现不错。不过在2024 年 10 月前后组合发生较大回撤,后续超额表现比较一般。

从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益。综合超额年化收益 8.84%,信息比率 1.99,超额最大回撤4.86%。
3.2 混频模型表现
barra5d+日行情模型的混频模型,结合了长期预测和短期预测的能力。IC 表 现和多空表现更为稳定。中证 1000 超额组合上看也显著修复了 barra5d 模型 2024 年 10 月后表现不佳的问题。
从中证 1000 增强组合上看,整体上超额收益较为稳定,每年都取得正的超 额收益。综合超额年化收益 11.32%,信息比率 2.42,超额最大回撤 8.19%。
3.3 基本面对混频模型的作用
引入基本面后 IC 表现和多空表现进一步提升。中证 1000 超额组合上看不 仅修复了 barra5d 模型 2024 年 10 月后表现不佳的问题,也解决了 barra5d+日 行情模型 21 年回撤较大的问题。每年的超额收益分布更为均匀。
从中证 1000 增强组合上看,整体上超额收益强势,每年都取得正向且稳定 的超额收益。综合超额年化收益 11.82%,信息比率 2.39,超额最大回撤 5.70%。
对比发现,barra5d 模型在加入日行情模型后显著提升了 2024 年下半年以 后的表现,再引入基本面信息可以使得超额收益在不同年份的分布更加稳定。
3.4 其他指数增强组合表现
选取主流的沪深 300 指数、中证 A500 指数、中证 500 指数以及科创综指, 使用 barra5d+日行情+精简基本面 GRU 因子构建指数增强组合,组合优化参数与 上文一致,仅改变基准。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行.pdf
- 中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期.pdf
- 中国特色衍生品交易账户体系建设探索-金融市场研究.pdf
- 基于行为金融视角的A股市场月频动量效应失效原因与修正策略-金融市场研究.pdf
- 中国金融机构人才发展与培训白皮书(2026年).pdf
- 金融工程:基金窗口粉饰行为的定量识别与FOF投资应用.pdf
- 金融工程:高波动环境下如何捕捉热点板块的投资机会?.pdf
- A股量化择时研究报告:金融工程,AI识图关注船舶、电网、钢铁、机器人.pdf
- 金融工程,大类资产及权益风格月报(2026年2月):权益资金流边际改善,小盘成长风格有望占优.pdf
- 金融工程指数量化系列:高值偏离修复模型(突破型双位点).pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 北京大学数字普惠金融指数(2011-2021).pdf
- 2 2020中国金融科技创新大赛优秀案例集.pdf
- 3 区块链与数字货币深度解析:科技如何重塑金融(103页).pdf
- 4 中国银行中国经济金融展望报告(2022年第3季度):“三重压力”倍增,政策全力稳定宏观经济大盘.pdf
- 5 中国工商银行金融科技研究院:商业银行生物识别技术应用实践及趋势分析.pdf
- 6 2020年全球金融科技指数报告.pdf
- 7 供应链金融创新发展报告2019.pdf
- 8 详解微众银行,见证金融科技的力量.pdf
- 9 2019开放银行与金融科技发展研究报告.pdf
- 10 金融集团大数据分析平台总体架构方案.pptx
- 1 金融壹账通:2024年环境、社会及管治报告.pdf
- 2 2025年中国金融科技(FinTech)行业发展洞察报告.pdf
- 3 阿里云:2025年金融行业Agent百景图.pdf
- 4 RWA行业研究报告:真实资产走向链上世界,开启数字金融新时代.pdf
- 5 区域经济与银行股系列专题报告:山东省三项动能支撑,基建+产业升级+新兴,金融需求持续性强.pdf
- 6 金融工程专题报告:使用投资雷达把握行业轮动机会.pdf
- 7 蚂蚁数科:2025金融智能体深度应用报告.pdf
- 8 RWA行业分析:为实体资产开启数字金融世界之门.pdf
- 9 稳定币行业专题报告:重塑全球金融秩序的变量.pdf
- 10 多元金融行业分析报告:稳定币如何影响和变革传统金融?.pdf
- 1 科技新周期系列1:穿越泡沫,从技术革命到金融资本.pdf
- 2 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 3 A股量化择时研究报告:金融工程,AI识图关注中药、银行和红利.pdf
- 4 非银金融行业深度报告:海南全岛封关运作,跨境资管空间广阔.pdf
- 5 金融行业:金融业监管2025年度数据处罚分析及洞察建议.pdf
- 6 中国金融智能体发展研究与厂商评估报告 (2025).pdf
- 7 金融产品深度报告:广发中证传媒ETF(512980.SH),政策规范护航,AI产能兑现,低估值传媒ETF走向高质量增长.pdf
- 8 金融行业周报(20251214):公募销售新规落地,政银绑定深化下银行扩表动能有望复苏.pdf
- 9 5G环境下供应链金融解决方案.pdf
- 10 非银行金融行业研究:数字人民币专题,应用场景空间广阔,2.0时代将加速发展.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
