2025年计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”

  • 来源:国泰海通证券
  • 发布时间:2025/11/19
  • 浏览次数:1528
  • 举报
相关深度报告REPORTS

计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”.pdf

计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”。金融行业数智化转型需求与大模型技术特性高度契合,是AI应用落地的绝佳“试验田”;2025年DeepSeekR1的发布成为金融机构本地化部署AI的行业拐点。行业内驱+政策外驱,金融AI应用落地拐点已至。自2018年OpenAI推出第一个版本的GPT模型GPT-1以来,经过多年发展,通用大模型技术已跨越“技术验证”向“产业适配”的关键拐点,AI在垂直领域的规模化应用落地已箭在弦上,将逐渐进入加...

1. 投资分析

我们认为,当前通用大模型技术已渐成熟,大模型在垂直领域的规模化应用 落地已箭在弦上,将逐渐进入加速期。金融行业作为典型的数据、信息、决 策密集型产业,其数智化转型需求与大模型技术特性高度契合,随着人工智 能相关政策在金融领域的持续落地,金融机构有望由“数智化”进一步向“人 工智能化”转型。 从产业内部来看,2024 年以来金融大模型相关招投标已开始加速。2025 年 DeepSeek R1 的发布助推通用模型推理能力跃迁和成本锐减,并实现模型开 源,成为金融机构本地化部署 AI 的行业拐点。目前,AI 应用已在各类金融 机构的核心业务领域以及中后台场景中加速渗透,未来 AI 有望重构金融业 务流程和组织架构,为金融数智化打开新纪元。

2. 行业内驱+政策外驱,金融 AI 落地加速已是必然

2.1. 外驱:产业趋势与政策共振,金融机构 AI 转型动力强劲

2.1.1. 大模型技术特性与金融行业数智化转型需求高度匹配

通用大模型技术已渐成熟,AI 应用在垂直领域落地已箭在弦上。2017 年, 谷歌发布 Transformer 架构,为后续 LLM、GPT 的建设提供基础的框架支 持,随后在 2018 年,OpenAI 推出了第一个版本的 GPT 模型 GPT-1,引领 了大语言模型技术迭代和发展的狂潮。经过多年的发展,通用大模型技术已 渐成熟,这也推动了新一轮行业生产力变革,凭借大模型在场景泛化、技术 涌现、强计算能力等方面的优势,大模型为多个行业的发展带来了工业革命 级生产能力的提升。 但随着大模型能力的普及,通用大模型技术已跨越 “技术验证” 向 “产业适 配” 的关键拐点,单纯提供基础模型 API 的商业模式面临着日益激烈的同 质化竞争和价格压力。自 2023 年起,国内外多家科技企业开始推出针对特 定专业领域应用的产业大模型产品,依托自身专业领域特征及通用大模型 建设基础,推动大模型技术实现产业落地应用的最后一环。我们认为,当前 AI 大模型在垂直领域的规模化应用落地已箭在弦上,将逐渐进入加速期。

大模型技术特性与金融行业数智化转型需求高度匹配. 金融行业属于数据、 信息密集型产业,对于多渠道信息汇总及数据处理能力有较高要求,业务场 景中面临的海量数据分析交易决策制定、个性化投资建议等环节对于金融 从业者的专业知识储备与经验判断提出了较高要求,而大模型在自然语言 的处理、计算机视觉应用、知识图谱问答等环节具有强大的数据处理与分析 能力,能够优化数据处理模式,降低人力错误,并在关键决策的判断上给予 金融从业者系统性支持。

2.1.2. 顶层设计驱动金融机构向“人工智能化”转型

金融行业属于政策导向型产业,顶层设计和政策指引对金融行业的发展方 向具有决定性作用。近年来,在金融科技发展规划与金融机构数字化转型一 系列政策的指导之下,国内金融行业的数智化转型颇具成效。我们认为,人 工智能相关政策在金融领域的持续落地,为金融机构由“数智化”进一步向 “人工智能化”转型提供强劲外部驱动。 2025 年 8 月,国务院印发《关于深入实施“人工智能+”行动的意见》,明 确提出到 2027 年,率先实现人工智能与 6 大重点领域广泛深度融合,新一 代智能终端、智能体等应用普及率超 70%,智能经济核心产业规模快速增 长,人工智能在公共治理中的作用明显增强,人工智能开放合作体系不断完 善。到 2030 年,我国人工智能全面赋能高质量发展,新一代智能终端、智 能体等应用普及率超 90%,智能经济成为我国经济发展的重要增长极,推 动技术普惠和成果共享。此外,该政策还强调要推动新一代智能终端、智能 体在金融等服务业的广泛应用。 2024 年 11 月,中国人民银行等七部门联合印发《推动数字金融高质量发展 行动方案》,强调要加强数字金融相关新型基础设施建设,布局先进高效的 算力体系,加快云计算、人工智能等技术规范应用,探索运用边缘计算和量 子技术突破现有算力瓶颈,为金融数字化转型提供精准高效的算力支持。 2025 年 3 月,国家金融监督管理总局办公厅等三部门联合印发《银行业保 险业科技金融高质量发展实施方案》,鼓励金融机构加大数字化转型投入, 运用云计算、大数据、人工智能、机器学习、隐私计算等技术,研发数字化 经营工具。 2025 年 5 月,人民银行科技司司长李伟在《中国金融杂志》发表署名文章 《稳妥有序推进金融领域人工智能大模型应用》,文章提出“要把握历史机 遇、迎接现实挑战,稳妥有序推进人工智能大模型应用,加快金融数字化、 智能化转型,为做好金融“五篇大文章”和推进金融高质量发展注入智慧动 能。”

2.2. 内驱:金融机构 IT 支出持续扩张,大模型相关招投标明显 加速

金融机构 IT 支出随数智化转型而持续扩张。随着智能化和数字化转型进程 的推进,国内金融机构对客产品和服务科技水平逐步提升,内部的数智化平 台建设与信创系统切换也在稳步推进,另外以金融大模型为代表的新兴生 产力的崛起进一步推动了金融市场的科技需求,这些因素均驱动我国金融 机构科技投入规模持续扩张。 根据艾瑞咨询统计数据,2023 年,我国金融机构科技投入总规模达到 3598 亿元,同比增长 9.8%,2024-2028 年预计市场整体将以约 13.3%的复合增长 率高速增长,2028 年国内金融机构的科技投入规模或将突破 6500 亿元。 金融机构在 AI 领域的直接投入也在增加。根据 IDC 数据,2024 年中国金 融行业 Al and Generative Al 投资规模达到 196.94 亿元,到 2027 年将达到 415.48 亿元,增幅达到 111%。

金融机构积极推进 AI 落地,大模型项目招投标 2024 年开始加速。根据智 能超参数统计,2024 年全年金融行业共有 133 个大模型中标项目,其中 90 个项目披露中标金额,中标金额总额为 23961 万元。中标项目所覆盖金融 机构类型包括银行、证券、保险、金科公司、交易所、消金、监管机构等。 从数量上看,银行类机构发起的大模型相关采购项目数量最多(71 个),占 比达到 53%,其次是证券机构(20 个),保险(16 个),其他金融机构(26 个)。从披露的中标金额占比上来看,银行、证券稳居前两名,尤其银行机 构的金额占比也超过 50%。 从项目类型来看,应用类项目数量最多(82 个),占比 62%;算力类项目次 之,数量(27 个)占比 20%;大模型类项目(23 个)数量占比 17%,数据 类项目占比最少。从金额分布来看,应用类项目披露的金额占比排名第一, 算力类项目金额占比排名第二,大模型类项目金额占比排名第三,数据类项 目的金额占比最低。应用类项目数量和金额占比最多,表明金融机构比较关 注大模型技术在具体业务场景中的落地。

根据智能超参数统计数据,按照大模型中标项目的项目数量和披露项目金 额占比来计算,金融行业是 2024 年大模型中标的突出行业之一,项目数量 位列全行业第五,仅次于通信、教科、政务、能源行业。从季度统计数据来 看,2024 年 Q1 至 Q4 金融行业大模型中标项目数量和披露中标金额逐季度 环比均实现迅猛增长,证明大模型在金融行业的落地在持续加速。

3. 技术侧:模型能力持续迭代,DeepSeek 成为金融机 构 AI 部署拐点

当前 AI 与金融的结合主要有两条技术路径:1)通用模型+金融语料训练金 融大模型;2)金融垂类大模型。由于设计和训练目的不同,通用语言大模 型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、 数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精 度和合规性上,金融垂类模型更胜一筹。

3.1. 通用模型+金融语料:以 DeepSeek 为代表的推理大模型加速 渗透

3.1.1. 推理大模型增强了 AI 解决复杂金融问题的能力

自 2024 年 9 月 OpenAI 发布 o1 推理模型以来,推理大模型正在各行业加速 渗透。我们认为,OpenAI o1 引领了推理大模型的训练和迭代趋势, DeepSeek-R1 则将推理大模型性能和成本显著优化,为推理大模型在金融领 域的落地创造了条件,也显著加速了金融领域大模型落地应用的步伐。相比 基础的大语言模型,推理大模型在金融核心业务领域的落地适用性和应用 效果显著更优。 其一,推理大模型具备长思维链,解决复杂金融问题的能力更强。与基础大 语言模型不同,推理大模型能够构建长逻辑推理链条,还能在推理过程中, 利用 RAG 引入外部资料,实现推理效果的整体性提升。 其二,推理大模型可实现推理过程显性化。推理大模型可实现推理过程信 息整合以及推理过程审查,更能满足金融业务算法审查要求。推理大模型实 现了模型推理逻辑的实时可视化输出与完整性记录,其推理过程动态生成 推理思维链,能够根据规则显式标注每一步决策的输入数据源、逻辑转化规 则及推理可信度数值。这一机制使金融机构能够完整回溯推理路径,从而判 断大模型生产结果的可靠性。 在真实金融业务场景中,推理大模型的业务处理智能化水平更高。根据 CAICT 金融科技的研究,在智能投研领域,推理大模型的逻辑推理能力、 可审查性设计,弥补了传统短思考大模型在数值推演、投资决策及监管透明 性等环节的短板;在智能合规领域,推理大模型能够突破识别精度、跨场景 适配与非结构化处理瓶颈,构建动态风控体系;在智能客户服务领域,通过 深度推理与多模态交互优化,推理大模型能实现个性化解决方案生成与终 端轻量化部署,推动金融客服交互从标准化响应向专业级顾问升级;在智能运营场景中,推理大模型的强化学习架构与全链路思维链输出,能有效解决 决策黑箱化问题,提升自动化水平。

3.1.2. DeepSeek R1 成为金融机构本地化部署 AI 的行业拐点

DeepSeek R1 助推通用模型能力跃迁和成本锐减,并实现模型开源,成为加 速金融机构本地化部署 AI 的拐点。2025 年 1 月 20 日,深度求索正式发布 DeepSeek-R1,并同步开源,在性能比肩 OpenAI o1 的同时,大幅降低了算 力成本,瞬间引发了 B/C 端用户部署和试用的热潮。DeepSeek-R1 在后训练 阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升 了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

DeepSeek 推理模型仍在迭代,深度思考性能持续优化。2025 年 5 月, DeepSeek R1 模型完成小版本升级,升级后的版本为 DeepSeek-R1-0528。 相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升,例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%,这一 进步得益于模型在推理过程中的思维深度增强。而在幻觉问题上,新版 DeepSeek R1 也进行了优化,与旧版相比,更新后的模型在改写润色、总结 摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供 更为准确、可靠的结果。

我们认为,DeepSeek 一方面通过开源架构打破传统大模型商业模型的封闭 性壁垒,另一方面还能够基于自主可控的技术栈构建 AI 应用,有效规避了 对国外技术生态的过度依赖。在金融场景中,DeepSeek 大模型展现出三大 突破性优势:高开放性、高性能、高性价比。 高开放性:在金融行业,数据安全性至关重要。为满足严格的监管要求,许 多金融机构选择将数据存储和处理部署在本地,以确保数据的安全性和合 规性。DeepSeek 采用开源策略,支持金融机构私有化部署,能够充分满足 金融机构的应用需求。 高性能:DeepSeek 基于 MoE 架构,具备强大的逻辑理解和推理能力,在文 字、数字和逻辑密集处理的金融应用场景中,能取得良好效果。 高性价比:DeepSeek 相比其他同等性能的大模型而言,显著降低了算力需 求门槛,减少了部署成本。并且,依托模型压缩和蒸馏技术,其本地部署资 源消耗大幅降低。 我们认为,DeepSeek 带来的成本与效能的突破,正推动 AI 技术从头部机 构向中小金融机构等长尾市场加速渗透,打破了头部机构的“算力壁垒”, 有望重构金融行业的智能化竞争格局。

根据中电金信研究院统计,在 DeepSeek-R1 正式发布后,银行、券商、保 险等领域各大金融机构快速跟进了 DeepSeek 大模型的部署和应用。例如, 工商银行基于自研的“工银智涌”平台引入 DeepSeek 开源模型,构建财报 分析助手、AI 财富管家等 10 余个场景,提升复杂数据处理能力;邮储银行 依托自有大模型“邮智”,本地部署并集成 DeepSeek-V3 模型和 DeepSeekR1 推理模型,应用于智能客服“小邮助手”后,新增逻辑推理功能,可精 准识别用户需求,提供个性化和场景化的服务方案,加快响应速度和任务处 理效率。

券商方面,广发证券已将 DeepSeek 广泛应用于投行 AI 文曲星系统、投顾 知识问答、研报审核、代码辅助撰写等多个关键业务场景;国信完成了 DeepSeek-R1 模型的本地部署,在智能问答、投资顾问、个股分析等多个领 域表现出色。保险方面,人寿财险通过自主研发的“小财大模型”成功接入 满血版DeepSeek大模型,成功构建了多领域专业知识体系,并在保险营销、 理赔、客服等场景中实现了深度应用;太平人寿在内网完成 DeepSeek 本地 化部署,快速打造了太平人寿 AI 助手,该助手具备深度理解对话、文档及 图片的能力,能够为内勤人员解决复杂问题提供高质量的方案,从而大幅提 升工作效率。

3.2. 金融垂类大模型:更专注更懂金融的行业原生大模型

相比基于金融语料训练的通用大模型,金融垂类大模型在金融领域具有专 业的理解能力,更精熟于金融术语和概念,往往更适合解决金融行业的具体 问题,与行业需求和合规性要求相匹配。因此互联网大厂、金融机构以及金 融科技企业等也投入了大量资源进行金融垂类模型的研发。

3.2.1. 度小满开源金融行业推理大模型——轩辕-FinX1

2024 年 12 月,度小满开源业内首个金融行业推理大模型——轩辕-FinX1。 轩辕-FinX1 采用创新的“思维链+过程奖励+强化学习”训练范式,显著提 升逻辑推理能力,并可展示完整思考过程,为金融决策提供更深入的洞察。 此外,轩辕-FinX1 还针对金融场景中的分析、决策和数据处理任务进行了 深度优化。 在金融评测基准 FinanceIQ 上,初代轩辕-FinX1 表现明显优于一流通用大 模型,在 CPA、银行从业资格、证券从业资格等 10 大类金融权威资格认证 中,均超越了 GPT-4o 和开源模型 Qwen2.5-72B。

3.2.2. 蚂蚁数科推出原生金融推理大模型

2025 年 7 月 28 日,蚂蚁数科发布金融推理大模型 Agentar-Fin-R1,基于金 融实际应用场景原生,具备高度专业的金融知识、复杂的业务逻辑推理能力 以及严格的金融级安全合规。

数据层面:蚂蚁数科构建了全面专业的金融任务分类体系,包括 6 大 类、66 小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。 基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,提升模型处理复杂任务的能力, 让 Agentar-Fin-R1 “天生懂金融,出厂即专家”。

训练层面:创新的加权训练算法,提高了 Agentar-Fin-R1 对复杂金融任 务学习效率与性能。在后续业务应用中,可显著减少二次微调的数据 需求与算力消耗,有效降低大模型在企业落地的门槛与成本。

模型迭代层面:Agentar-Fin-R1 能不断更新迭代,吸收最新的金融政策、 市场动态等关键信息,并通过配套评测工具进行针对性优化,让模型 能力在真实业务场景中不断进化。 从评测结果来看,Agentar-Fin-R1 在 FinEval1.0、FinanceIQ 以及 Finova 等 金融大模型评测基准上均超越 Deepseek-R1 等同尺寸开源通用大模型以及 金融大模型,显示出更强的金融专业性、推理能力以及安全合规能力。

3.2.3. 东方财富自研妙想金融大模型

2024 年,东方财富妙想金融大模型正式开启内测,该模型使用 Decoder-only 的 Transformer 网络结构,支持 32K 的上下文长度,通过自建的数据治理 和数据实验流程,结合效果预估算法、高效预训练框架、SFT、RLHF 训练 等技术,致力于满足各类金融场景下的需求。 依托东方财富互联网券商综合运营平台,妙想大模型在金融数据供给、语 料专业度、场景支撑等方面具备优势。在数据供给方面,得益于多年深耕和 沉淀,东方财富构建了完备的金融数据、产业数据等行业通用数据集,股吧、 财富号等平台优质内容数据持续涌现,持续丰富平台的独家特色数据集。在 语料供给方面,截止 2024 年 1 月,妙想大模型储备的金融语料达 1.2 万亿, 涵盖行情、财务、资金、百科、资讯、公告、研报、问董秘等数十个维度、 上万种数据品类,且每月高质量数据几千亿 token 稳定增长。在场景支撑方 面,东方财富平台聚集了海量用户资源,积淀了多元的金融业务场景,使得 妙想大模型除了具备文本生成、语义理解、知识问答、逻辑推理、数学计算、代码能力等通用能力,更加具备金融场景的垂直能力。

重视投研场景,推出妙想投研助理。东方财富将投研场景作为妙想金融大模 型为金融行业赋能的第一个重点落地场景,致力于将妙想投研助理打造成 为深入了解行业 Know-How,真正理解各行业研究逻辑的“AI 研究员”。

3.3. 金融 AI Agent:多智能体协作正在成为趋势

智能体(AI Agent)是指具有自主性或半自主性的智能实体,能够利用人工 智能技术在数字或物理环境中感知、决策、采取行动并实现目标。智能体与 传统 AI 解决方案核心区别在于,智能体的设计和行动是以实现特定目标为 导向的,而不是遵循预先定义的规则完成单一或具体任务。通过感知环境并 与之互动,智能体表现出一定程序的适应性和学习能力。 根据 CAICT 金融科技的研究,目前在金融领域,大模型普遍应用在理解、 问答、信息提取等“短思考”场景,主要使用的是大模型的信息理解和生成 能力,并不要求大模型去自主承担具有长流程的工作任务,而这类任务需要 依赖金融 Agent。当前由于基座模型能力限制、思维链技术待成熟、Agent 平台不完善、算力成本高、金融业务建模难等原因,金融 Agent 尚不成熟, 我们认为,模型推理能力的提升加速了金融 Agent 时代的到来。 金融机构对智能体的应用正在加速。根据沙丘智库调研数据,总的来看,银 行在大模型和智能体技术方面的探索最为领先,证券和保险紧随其后。沙丘 智库截止 2025 年 8 月的调研数据显示,25.0%的银行、22.2%的证券公司、 13.6%的保险公司正在采用智能体技术,此外,37.5%的银行、40.7%的证券 公司、31.8%的保险公司计划在未来一年内采用智能体技术。

根据 CAICT 金融科技的研究,从智能体在具体业务场景中的应用能力上来 看,主要存在着两种应用方式:1)单智能体以较强的业务规划、自主操作 行为解决业务场景问题,执行具有单一成熟工作链路的任务。2)多智能体 借助分工协作的范式,形成多智能体协同工作的集群,执行适合分工协作的 复杂性任务。 相较于单智能体来说,多智能体存在着多方面的优势,包括:1)能够适用 于复杂、动态的金融环境,多个智能体之间通过协调合作,能够更好地应对 复杂和不断变化的市场条件。2)多智能体系统通过智能体间的协作和冗余 设计,提高了整体输出稳定性能。3)多智能体系统相较于能够充分借助各 个智能体之间的相互作用与影响,在复杂任务处理、资源分配等方面展现出 更高的效率与适应性。通过运用多智能体强化学习技术,各智能体能够根据 自身所处环境以及其他智能体的行为,不断调整自身策略以获取最大奖励, 从而提升整体性能。4)多智能体系统提供了更强的灵活性和扩展能力,能 够根据实际需求,结合不同的协同工作范式,灵活组合不同的智能体,以适 应特定场景。

出于金融业务处理场景的复杂性,多智能体协作正在成为金融领域 AI 应用 的重要趋势。根据蚂蚁技术 AntTech 的研究,金融行业是高密集度信息处理 和任务处理的行业:1)信息密集,金融业务强依赖高频更新的资讯,导致 严谨的时效性处理必不可少,另外,这些信息中大量属于相关但无因果关系 的噪声信息,需要有效屏蔽噪声才能做出正确决策。2)知识密集:金融中 的知识,不仅高密度,还是彼此高度对立的,在金融市场中,围绕各类资产 有各种不同的理论和分析,而基于这些理论分析必然生发出许多互相冲突 的观点,这些冲突构成了市场交易的基础。3)决策密集:金融领域的决策 有非常强的特殊性,其一是不确定性,金融决策面对的是开放环境,其他市场主体的参与和博弈带来了无穷变数,金融决策从头到尾都需要和不确定 性信息共舞;其二,金融决策是高度不对称的,往往在大量决策中只有个别 决策处于关键位置,带来关键收益(或避免风险)。我们认为,基于金融业 务处理场景的复杂性和特殊性,基础的大模型和单智能体往往无法通过标 准解法来处理金融领域的复杂决策问题,需要依托多智能体装载的相关过 程性 Knowhow 来保障金融的严谨和专业。 多智能体协作的主要突破方向,是量化金融与投资分析、金融异常检测、复 杂金融决策任务、代码项目自主开发等具有高规划要求场景。多智能体面 向这些场景,能够根据业务人员的需要,通过对话的方式生成业务框架和基 础,为业务快速完成提供信息、报告或代码基础,以及为业务人员提供信息、 建议等辅助作用。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至