金融机构落地大模型应用路径分析

金融机构落地大模型应用路径分析

最佳答案 匿名用户编辑于2025/03/17 14:22

当前,不同类型的金融机构在推进大模型的落地中,有着不同的路径选择。

1.路径1:金融机构自主主导开发和训练大模型

该路径往往需要金融机构投入较大的IT资源和人力资源,与之对应的金融应用场 景也较为复杂,需要大模型在金融领域专业知识、术语及政策等方面具有专业的 理解能力;这些场景对模型精度、模型安全,数据的可用性、丰富性、安全性, 以及业务合规等都有较高的要求,故自主开发和专门训练的金融垂类大模型可能 会更好地满足这些需求。根据IDC调研数据显示,金融机构考虑为 GenAI构建自有模型的主要考虑因素有成本/花费、对数据隐私及安全顾虑以及所 需数据的可得性。

例如,某证券与投资服务公司,基于其海量的数据资源,如宏观经济数据、行业 经济数据、企业研究报告、上市公司信息披露等结构化和非结构化数据,以及交 易所、政府部门、科研机构、高等院校、专业行业数据公司等机构提供的授权数 据,同时为了提高模型的通用能力,该公司自主研发了大模型,从训练语料、训 练框架到模型结构的设计,均从零开始、创新性地构建基础模型及金融大模型, 并且在预训练阶段就融合了金融领域的语料,而不是在微调阶段。这种做法使得 模型在知识学习上更为深入,能够理解金融领域中的复杂关系和概念。此外,为 了加速AI能力面向各场景的深入落地,该公司构建了AI开放平台,目前可面向客 户提供短视频生成、文章生成、数字虚拟人、智能金融问答、智能语音、智能客 服机器人、智能质检机器人、会议转写系统、智能医疗辅助系统等多项AI产品及 服务。

2.路径2:基于通用大模型/开源模型,叠加金融服务领域数据,通过使用参数微 调、提示词工程/检索增强生成等方式优化基础模型推进金融业务场景的落地

这种路径是金融机构基于基础模型,通过私域数据集进行模型训练调优,以实现 金融机构金融大模型的建设,该方式在特定任务上表现出来的性能和在特定领域 知识的深度理解会更强。在IDC的调研中,金融机构为GenAI使用第三方现有模 型的主要因素是成本/花费、模型性能/模型参数、以及数据可得性及数据隐私等 。

尤其是在数据层面,向量数据的管理和合成数据生成是金融机构着需解决的问 题。其中,向量数据库等创新技术现在已成为 GenAI 数据价值链的关键部分,包 括数据管理流程的整个生命周期,已被用于检索增强生成,因为它们可用于对存储 为高维数据的非结构化数据集执行搜索,可以轻松地与现有数据库集成,从而为 从LLM实施 GenAI 解决方案提供了一种更灵活、更高效的方式,以高效用于各种 应用场景,例如产品推荐、异常检测和业务分析等。而合成数据生成涉及创建模 拟真实数据特征的人工数据集。在分析中,它用于解决隐私问题和数据稀缺问 题,或模拟各种测试场景。通过生成代表性数据,可以在不泄露敏感信息的情况 下开发和完善模型。这种方法可以加速创新,提高模型性能,尤其是在处理有限 或敏感的数据集时,该方法特别适用。

在模型训练及调优方面主要通过微调、提示词设计、检索增强生成(RAG)等方 法,增强基础模型输出的准确性、知识实时性。 微调:使用金融领域数据和人工监督来调整预训练的模型,以提高金融领域 的模型性能。 选择该方式的考虑因素:具有特定领域性能的高复杂性用例,例如智能投 顾、支付分析、风险模型训练等。 检索增强生成(RAG):将金融领域的文档集合与预先训练的模型相结合, 使输出情境化,而不涉及LLM。选择该方式的考虑因素:金融机构拥有该领域的专有数据和标签数据。适用 的应用场景包括内容搜索/金融知识问答、事实调查/欺诈识别/风险监控、内 容生成/营销助手等用例。

提示工程:使用提示技术来影响预训练模型生成输出的准确性。 选择该方式的考虑因素:适用于不需要特定领域的上下文的用例,同时允许 用户级控制产生特定任务输出的场景,以便客户可以更加精准地获得其想要 的知识。

未来,随着诸多基座模型的开源,以及一系列低成本的微调/检索增强生成等技 术的出现,将有越来越多的金融机构,会基于其需求定制专属大模型。 例如,某国有银行从算力、数据、大模型、场景等维度推进大模型的落地:在算 力层面,通过构建一体化云原生的异构算力平台来管理和调度多元异构的AI算力 资源;在数据层面,围绕“采建管用”闭环,构建大模型训练和持续提升的基础 数据闭环;在大模型方面,其基础模型是采用第三方开源模型,包括业界主流的 开源模型以及正在做共建和联创的产业大模型,各个基础模型之间可以无缝切 换,具有灵活的适配性,而对于金融大模型平台,包括NLP、CV、多模态等大模 型,主要是通过组件化(例如微调组件、RAG组件等)方法快速优化各类开源模 型和商业模型,以实现各类金融场景的接入,目前已在智能客服、智慧三农、智 能营销、智能运营、智能风控等场景进行探索及应用。

3.路径3:按需接入各类大模型API(按需付费的SaaS订阅模式)

这种路径主要是以SaaS模式面向金融机构提供服务,通过将生成式AI模型能力封 装为API服务接口,金融机构以外采订阅的形式,可以通过API将GenAI模型嵌入 自研应用软件增强智能化水平,或是基于API创建定制化的全新智能应用,通过 嵌入式AIGC应用,进行场景变革或产品升级。

选择该路径推进GenAI应用的场景往往是那些标准化程度较高的通用类场景,金 融机构通过API接口的形式将第三方生成式AI内嵌于应用之中,可以开箱即用。 比如,将生成式AI内置于HR SaaS软件,实现以智能问答的交互形式服务员工。 例如,某金融机构通过使用某云厂商合作(即:金融机构外采模式),利用云厂 商的全栈解决方案(从计算基础设施到数据库,再到金融场景服务)来帮助金融 机构构建其GenAI支持的SaaS,所有这些都在云服务环境中完成。如此客户就无 需启动大量工具和服务来开发GenAI功能。该方法在数据保护方面,主要是通过 在第三方系统中托管数据库以满足金融机构对数据安全性及合规要求。

4.路径4:与战略合作伙伴协同推进GenAI的场景落地

金融机构也可以与AI基础大模型厂商、AI大模型平台服务商、以及AI应用开发和 集成服务商、咨询/服务商等战略合作伙伴合作推进GenAI的场景落地。例如,在 与基础大模型厂商合作方面,通过选择与业务应用场景相匹配的基础大模型,例 如如果金融机构需要将大模型应用在面向零售业务的智能客服场景,则其应优先 选择在自然语言处理方面有较大优势的基础大模型。在与大模型平台服务商合作 方面,通过与AI平台服务商合作构建多种AI工具和能力(如自然语言处理、图像 识别等多种能力和工具),用于支持AI应用的开发与部署,并集中管理AI模型、 运维和治理确保AI系统的稳定运行和合规性。在AI应用开发和集成服务商方面, 通过选择利用厂商在该领域的AI应用开发与集成能力,如计算机视觉(CV)、自 然语言处理(NLP)、知识图谱(KG)和文档智能(Doc AI),结合具体场景来 为金融机构大模型的落地提供应用开发与集成服务。

综合来看,不同路径的选择对于金融机构内部人才、数据以及预算的要求等各不 相同;同时,鉴于金融对专业性要求较高,且需要遵守各类流程和规范,每一种 路径对于战略竞争优势、模型控制以及安全和隐私等方面的影响均有不同。

参考报告

中国金融行业大模型发展白皮书:开启智能金融新时代.pdf

中国金融行业大模型发展白皮书:开启智能金融新时代。AI大模型成为新质生产力的重要组成部分,国内外科技公司正加速布局。AI大模型已成为新质生产力的重要组成部分,能够大幅提高生产效率,优化资源配置,降低生产成本,为企业高质量发展提供强大的技术支持和动力。当前,美国、中国、日本、欧盟等全球主要地区的科技公司正加大大模型技术的创新及应用。在未来GenAI投资分配上,中国和全球企业几乎都会平均分配在生产力提升应用场景、跨行业水平职能应用场景、以及垂直行业专属应用场景上。AI大模型在金融行业的应用场景正从简单到复杂加速分步推进IDC认为,生成式AI的行业应用往往都是循序渐进的过程,一般是逐渐从内部辅助运营...

查看详情
相关报告
我来回答