2025年高频因子跟踪:Gemini 3 Flash等大模型的金融文本分析能力测评
- 来源:国金证券
- 发布时间:2026/01/13
- 浏览次数:93
- 举报
高频因子跟踪:Gemini 3 Flash等大模型的金融文本分析能力测评.pdf
高频因子跟踪:Gemini3Flash等大模型的金融文本分析能力测评。大模型加速技术不断优化,相关模型金融文本分析能力测评十二月以来,以“响应速度”作为优势的大模型出现了快速迭代:英伟达推出的Nemotron3Nano模型输出速度达到每秒358Tokens,是当前所有模型中响应速度最快的模型;小米推出MiMo-V2-Flash大模型是当前国产模型中速度最快,也是最具“性价比”的大模型;Gemini3Flash在追求高输出速度的同时兼顾较强的模型智能,综合评价下成为当前模型首选。我们以Nemotron3Nano模型为案例,详细梳理其高速推理所需要的...
大模型加速技术不断优化,相关模型金融文本分析能力测评
十二月以来,以“响应速度”作为优势的大模型出现了快速迭代: 1. 2025 年 12 月 15 日,英伟达推出了完全开源的 Nemotron 3 Nano 模型,其输出速度达 到每秒 358Tokens,是当前所有模型中响应速度最快的模型; 2. 2025 年 12 月 16 日,小米推出 MiMo-V2-Flash 大模型,其每秒 150 Tokens 的输出速 度叠加每百万 Tokens 0.15 元的费用,使其成为最具“性价比”的大模型,也是当前 国产模型中速度最快; 3. 2025 年 12 月 18 日,Gemini 3 系列推出 Flash 版本,在追求高输出速度的同时兼顾 较强的模型智能。

模型能力层面,其输出速度、或是更综合的响应速度已成为一个非常关键的对比维度。语 音对话、实时编程辅助、Agent 自主决策、端侧应用等多种应用场景均需要底层大模型有 较快的反馈速度,才能带来较好的使用体验。
1.1 底层架构优化显著提升大模型响应速度——以 Nemotron 3 模型为例
英伟达在推出 Nemotron 3 Nano 模型的同时也发布了模型白皮书,因此我们可以了解到模 型架构等底层信息。总结来说,Nemotron 在架构层面做了 4 处改进:
a) Mamba-2 + Transformer 混合 Moe 架构
Nemotron 3 系列模型将传统架构中 MoE 之间的自注意力层换为 Mamba-2 模型,实现了更 高效的模型输出。传统架构中的自注意力层会在推理过程中维护一个 KV 缓存,其参数量 伴随推理的迭代线性增长;而 Mamba 架构中的状态层在多轮迭代中参数量不变。这使得模 型在处理百万级的长文本时依旧能保持极快的速度。 当然,模型在部分关键层级上依旧保留了自注意力层,保留其处理复杂逻辑推理的能力。
b) 更加稀疏的 LatentMoE 层
此次 Nemotron 3 模型的 MoE 层中的专家数量达到了 128 个,每次激活 6 个。因此,尽管 总参数达到 31.6B,但实际每次前向传播仅激活 3.6B 参数,进一步节省推理资源。在单 张 4090 显卡上就能实现低于 100 毫秒的首字延迟。
c) 多 Token 预测(MTP)
MTP 在 DeepSeek-V3 模型中就已经得到使用,也证明了其在推动模型进行多步预测、提升 模型推理效率方面是有效的。Nemotron 3 模型中使用的集成 MTP 提升了模型在代码生成、 推理、阅读理解等多种类任务上的整体表现,也帮助实现了更快速、低延迟的推理效果, 加速整体的文本生成速度。
d) 模型参数 NVFP4 量化
Nemotron 3 使用了英伟达显卡所独有的 NVFP4 量化格式,内存占用更小的条件下可实现 与 BF16 等更高精度量化模型相类似的效果。为了保证模型能力,架构仅在少数的自注意 力层上保留了 BF16 精度,且每个自注意力层只保留两组 KV 缓存,在性能与效率之间进行 了精巧的平衡。
以上手段基本囊括了当前业界在模型速度方面可做的所有优化,也因此 Nemotron 3 Nano 在响应速度上做到了极致。不过其作为一个 30B 的小参数模型,模型能力无法与 Gemini 3 Flash 等闭源大模型相比较。
1.2 Gemini 3 Flash 及其他模型的中文金融文本分析能力对比
Gemini 3 Flash 模型实现了真正兼顾响应速度与模型性能两方面。从官方公布的基准对 比结果上来看,Gemini 3 Flash 性能显著超越了此前的 Gemini 2.5 Flash 以及其他系列 中的 flash 版本模型,整体能力更接近 Gemini 3 Pro 版本。
不过从应用场景上来说,我们更关心模型在金融领域的应用能力。因此,我们使用 CFLUE 测试集对各模型能力进行评测。CFLUE 是一个开源的测评基准,由阿里云与苏州大学联合 构建,分为以下两大部分。 金融知识评估: 3800 余道来源于 15 类金融资格考试的多项选择题,用于衡量模型 对金融基础知识与推理的掌握。

在所有模型中,Gemini 3 Flash 达到了最高的正确率;DeepSeek 系列模型在金融知识的 准确度普遍较高,其中 DeepSeek-V3.2 Reasoner 和 Speciale 模型格外突出。在解题思路 相似度上,尽管是 DeepSeek-V3 得分最高,但我们认为其背后原因在于 V3 给到的解题思 路相对更短,使得对应的词频相似度偏高。这也侧面反映了后续 DeepSeek 系列模型普遍 存在的问题,即生成的回答长度普遍偏长。相比之下,Gemini 3 Flash 整体表现最为突 出。
在金融应用领域,我们对更多模型进行了能力测试。整体来看,DeepSeek-V3.2 Speciale、 Gemini 3 Pro、GPT 5.2 等各家最先进的大模型在应用领域差异不大,相对来说 DeepSeek 系列在中文金融文本方面得分较高。此外,在各系列中最快大模型的能力对比上, DeepSeek-V3.2 Chat 表现最佳。
高频因子超额收益概览
过去一周,各类高频因子多头组合在中证 1000 指数成分股中的表现稳定。其中,价格区 间类因子多空收益率-1.64%,多头超额收益率-1.00%。量价背离因子多空收益率-4.59%, 多头超额收益率-2.21%。遗憾规避因子多空收益率为 0.09%,多头超额收益率 0.45%。
高频价格区间因子
在前期研究中,我们从高频数据的角度探究了市场的日内微观结构。利用三秒的快照数据, 发现: 高价格区间成交笔数与成交量因子与股票未来收益呈现显著的负相关性,即股票在日内 高价格区间投资行为聚集程度与成交活跃度越低,未来上涨可能性越大。低价格区间平均 每笔成交量因子与股票未来收益呈现显著的正相关性,即低价格区间的平均每笔成交量 越大,大资金活跃程度越高,股票未来上涨可能性越大。

高频量价背离因子
在前期深度报告《Alpha 掘金系列之二:基于高频快照数据的量价背离选股因子》中,我 们发现,当量价出现背离时,无论当前股价处在上升还是下降通道,未来上涨的可能性均 较高;同理,当量价趋同时,股价未来下跌的可能性较高。 我们利用高频快照数据对价格和成交量的相关关系进行衡量,分别用快照成交价和快照收 益率与快照成交量、成交笔数和每笔成交量计算。
遗憾规避因子
在前期深度报告《Alpha 掘金系列之四:基于逐笔成交数据的遗憾规避因子》中,我们利 用行为金融学中的遗憾规避理论发现,利用投资者的遗憾规避情绪可以构造出有效的选股 因子。如某只股票买入浮亏占比较高或买入浮亏程度较大时,股票的预期收益会更高;卖 出后股价反弹的占比越高或反弹程度越大时,股票的预期收益会更低。 我们利用逐笔成交数据区分了每笔交易的主动买卖方向,发现在加入小单和尾盘的限制后, 因子的表现有进一步的提升。
斜率凸性因子
股票作为二级市场上被广泛交易的标的,其价格与供需量的变化受到供需弹性的规律影响。 而高频快照数据中的限价订单簿所独有的委托量和委托价信息,为我们提供了绝佳的研究 数据来源。我们首先将委托量数据按照其档位进行累加,用委托价和累计委托量计算出买 卖双方的订单簿斜率。发现日频斜率因子基本符合我们的一般认知:即买方斜率越大,股 票的需求弹性越小,买方投资者对于股票的价格敏感程度较低,则股票有更高的预期收益。 对于卖方而言,斜率越小则股票的供给弹性越大,即减少相同的价格会有较大程度的委托 量降低,表明卖方不愿轻易降价卖出,同样对应到股票更高的预期收益。 我们将按照订单所在档位区分为高档位投资者斜率因子和低档位斜率因子,并根据两者的 反向关系构建出斜率凸性因子。最后提取出低档斜率因子(Slope_abl)和高档位卖方凸 性因子(Slope_alh)进行合成。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
-
标签
- 金融
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 北京大学数字普惠金融指数(2011-2021).pdf
- 2 2020中国金融科技创新大赛优秀案例集.pdf
- 3 区块链与数字货币深度解析:科技如何重塑金融(103页).pdf
- 4 中国银行中国经济金融展望报告(2022年第3季度):“三重压力”倍增,政策全力稳定宏观经济大盘.pdf
- 5 中国工商银行金融科技研究院:商业银行生物识别技术应用实践及趋势分析.pdf
- 6 2020年全球金融科技指数报告.pdf
- 7 供应链金融创新发展报告2019.pdf
- 8 详解微众银行,见证金融科技的力量.pdf
- 9 金融集团大数据分析平台总体架构方案.pptx
- 10 2019开放银行与金融科技发展研究报告.pdf
- 1 金融壹账通:2024年环境、社会及管治报告.pdf
- 2 2025年中国金融科技(FinTech)行业发展洞察报告.pdf
- 3 阿里云:2025年金融行业Agent百景图.pdf
- 4 RWA行业研究报告:真实资产走向链上世界,开启数字金融新时代.pdf
- 5 区域经济与银行股系列专题报告:山东省三项动能支撑,基建+产业升级+新兴,金融需求持续性强.pdf
- 6 金融工程专题报告:使用投资雷达把握行业轮动机会.pdf
- 7 蚂蚁数科:2025金融智能体深度应用报告.pdf
- 8 RWA行业分析:为实体资产开启数字金融世界之门.pdf
- 9 稳定币行业专题报告:重塑全球金融秩序的变量.pdf
- 10 多元金融行业分析报告:稳定币如何影响和变革传统金融?.pdf
- 1 科技新周期系列1:穿越泡沫,从技术革命到金融资本.pdf
- 2 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 3 A股量化择时研究报告:金融工程,AI识图关注中药、银行和红利.pdf
- 4 非银金融行业深度报告:海南全岛封关运作,跨境资管空间广阔.pdf
- 5 金融行业:金融业监管2025年度数据处罚分析及洞察建议.pdf
- 6 中国金融智能体发展研究与厂商评估报告 (2025).pdf
- 7 金融产品深度报告:广发中证传媒ETF(512980.SH),政策规范护航,AI产能兑现,低估值传媒ETF走向高质量增长.pdf
- 8 金融行业周报(20251214):公募销售新规落地,政银绑定深化下银行扩表动能有望复苏.pdf
- 9 5G环境下供应链金融解决方案.pdf
- 10 非银行金融行业研究:数字人民币专题,应用场景空间广阔,2.0时代将加速发展.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 1 2026年综合金融行业金融和理财市场2月报:含权理财收益崛起,宽基ETF规模下行
- 2 2026年中国平安首次覆盖报告:AI+综合金融生态,有望开启成长新周期
- 3 2026年金融工程:基金窗口粉饰行为的定量识别与FOF投资应用
- 4 2026年量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用
- 5 2026年非银行金融行业深度研究:资本市场范式转移,险资放量、券商扩表、公募重塑
- 6 2026年非银金融行业机构行为更新专题:验证“存款搬家”,居民财富的视角
- 7 2026年第10周高频和行为金融学选股因子跟踪周报:石油石化行业拥挤度较高,高频技术指标类因子表现较好
- 8 2026年政策性金融工具,能撬多少倍?——“财政的底色”系列报告(四)
- 9 2026年金融产品每周见:金融地产行业基金,从投资能力分析到基金经理画像
- 10 2026年非银金融行业春季投资策略:存款迁移,非银负债和资产两端受益
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
