金融行业在数字化时代领航,开创了 FinTech。今天,AI 大模型与金融行业融合,在数字化 所积累的海量数据资产基础上,金融行业具备在数智化时代继续领航的先发优势。
1.金融
1.1 降本到增效 : 从办公辅助走向业务决策
金融机构一直是率先将新兴的 IT 技术应用于业务场景的行业。目前,领先金融机构已经纷纷投 入人工智能 (AI) 技术,尤其是大模型技术的研发和布局,使能业务运营、产品营销、风险控制和客 户服务等业务领域,从而提升金融服务的智能化。根据 IDC 相关报告,90% 的银行已经开始探索 人工智能的应用,AI 技术成为银行技术创新的主要方向。
在智能营销场景,通过 AI 技术分析大量的用户数据,并基于客户需求和偏好提供个性化的金融 服务。这不仅提升了用户体验,同时增强了客户粘性。如,交通银行利用 AI 技术挖掘客户兴趣 偏好,用大模型强化业务端留客能力,各类理财模型策略累计触客成交量近 4 千亿元,较传统 方式成交率提升 16 倍。 在智能理财场景,AI 技术通过机器学习和深度学习模型,能够帮助投资者更准确地做出投资决策。 江苏农行和中国工商银行分别推出了类 ChatGPT 的大模型应用 ChatABC 和基于昇腾 AI 的金 融行业通用模型,用于智能化地推荐理财产品。上海浦发银行则利用多模态人机交互、知识图 谱等技术,推出了 AI“理财专家”,为消费者推荐合适的理财产品。
在信贷审批的风控场景,AI 帮助简化和优化了从信贷决策到量化交易和金融风险管理的流程, 亚太区域某头部银行通过 AI 技术实现了用户信贷申请过程从原来的数天缩短到只需一分钟完成 申请,最快一秒钟获得审批。 智能客服在金融服务中有着显著的应用。以招商银行信用卡公司为例,通过智能客服每天为客 户提供超过 200 万以上的在线人机交互,并能够解决 99% 的用户问题。智能客服不仅能提升 客户服务效率,相对于人工客服,还能够提供 24 小时不间断服务。
1.2 完善多源多元海量数据管理,加强数据安全合规建设
在人工智能应用逐步普及的过程中,金融机构在数据架构、数据安全和业务连续性等方面面临 新的挑战。 1、首先,是庞大数据量的管理,金融行业在数据量方面已经达到了 EB(Exabyte,即艾字节) 级别。以中国为例,根据北京金融信息化研究所(FITI)2023 年发布的最新报告,目前金融机构 的数据量普遍达到 PB 级,其中大型金融机构的数据量超过 100PB,并且未来五年预计年均增幅 将达到 24.33%。此外,国有大型银行的核心业务系统存储规模也已达到百 PB 级,票据影像等非 核心系统存储规模更是达到了几十 PB 甚至百 PB 级。围绕金融行业海量业务数据,如何实现高可靠、 高效率的访问,进一步实现数据价值最大化,是金融机构必须考虑的问题,例如,针对海量的数据 量及不同的数据类型,采用高性能的存储设备以及优化存储架构,加快 AI 与金融行业的融合。

2、其次,金融业务需要处理种类多样的数据类型,经过多年的业务积累和沉淀下来的数据,比如: 图片,视频,音频,以及互联网日志等各类金融数据,不但数据格式陈旧复杂,而且分散在不同的 业务领域,甚至不同的地域。比如大小机核心系统的数据格式无法直接与开放平台的信用卡系统的 数据格式进行数据交换;信贷业务,财富管理业务和互联网业务之间很难实现用户信息共享。将这 些分散的数据整合并准备用于人工智能应用是一项艰巨的任务,急需建立一个完善的数据管理系统。 如中国某头部银行一直将数据视为基础要素和战略资源,在建立大数据资源管理系统方面,面临有 哪些数据,数据在哪里,如何有效利用这些数据的关键问题。
3、最后,金融行业数据处理,还必须满足行业监管和风险控制的合规要求。利用 AI 技术进行 个性化推荐和精准广告投放的精准营销场景,对数据管理和隐私保护的挑战进一步增大,进而促进 金融合规监管的要求提升。同时,人工智能应用增加了金融机构数据泄露的风险。2024 年 5 月, 美国某知名银行遭 LockBit 勒索软件攻击,导致约上百万名客户数据被盗。2024 年 6 月,中国国 家金融监督管理总局网站公布,中国某头部银行因数据安全管理不足、灾备管理不足,被罚数百万元。 因此,以容灾为基本手段的数据物理安全,和以备份为基本手段的数据逻辑安全保障等多重手段在 当前 AI 时代显得尤为重要。
国际货币基金组织 IMF 发布的《Global Financial Stability Report》指出,日 益增长的人工智能和数字化应用,显著增加网络数据安全风险。 因此,金融机构拥抱 AI 新技术应用,重塑服务模式,唤醒数据价值的同时,要关注 AI 技术对 数据管理所带来的挑战,才能有效提升金融服务的效率和品质。
2.运营商
2.1 开发到应用 : 蓄力大模型训推,对内运营增效,对外赋能千行万业
当前全球运营商形成三波 AI 阵营,第一波智能化先锋正在构建“终端设备、智算资源、模型 应用”的全栈 AI 能力,如韩国 SKT、中国移动等;第二波运营商积极布局行业大模型,如新加 坡电信 Singtel、德国电信、阿联酋 e& 等合资成立全球电信 AI 联盟(Global TelcoAIAlliance, GTAA),以专门开发及推出多语言的电信语言大模型服务话务中心和智慧运营;第三波务实型 运营商关注 AI 带来的实际价值,尝试借助第三方合作伙伴的 AI 能力实现降本增效,如 Orange、 Vodafone 等计划通过 AI 提升智能客服效率。 未来两到三年,运营商的大部分应用和业务都将被 AI 重塑。据 Valuates 预测,2027 年全球 电信 AI 市场规模将增长到 150 亿美元,近三年年均复合增长率 42.6%。生成式 AI 主要通过两个 方面助力运营商行业:
1、AI 应用与运营商现有业务结合,实现业务效率提升 利用人工智能的分析、策略优化与预测等能力来赋能网元、网络等业务系统,有助于提升电信 网络的智能规建、运维、管控能力,并最终实现 L4/L5 级网络自动驾驶。如:韩国 KT 的 AI 语音 机器人具备实时自动总结等功能,将客户请求的时间从 20 秒减少到了 5 秒。中国移动反诈骗系统 月度拦截电话量超过 1400 万,准确率高达 98%。 2、对外赋能产学研用,推动智能升级 一方面,运营商可以直接为大模型企业或教育研究机构提供智算服务,做 AI 淘金时代“卖铲人”。 另一方面,运营商可以将大模型能力外溢至行业客户,面向政务、教育、医疗等推出行业大模型新 应用。如:中国移动九天政务大模型为甘肃打造智慧政务助手,构建 20 万实体和 1000 万业务关 联的政务知识图谱以及 100 万级标准问答,为省内 2500 万的百姓提供便捷、高效的数智政务服务。
2.2盘活海量数据,助力高效训练,使能大模型行业落地
运营商要抓住大模型的发展机遇,需要构建 AI-Ready 的基础设施,AI-Ready 的前提是 Data-Ready。与此同时,AI 集群规模不断扩大,现在已经已迈入万卡时代,大投入能否带来显 著收益,将面临两大具体挑战: 挑战一:如何盘活运营商数据资产,更好地让大模型应用服务自身业务? 在数字化、智能化的趋势下,数据已经成为继土地、劳动力、资本、技术之后的“第五大生产 要素”,是驱动数字经济深化发展的核心动力。特别是随着生成式 AI 大爆发,AI 大模型赋予了数 据新的生命力,数据蕴含的价值进一步涌现,没有充足、优质的数据,大模型的学习能力将大打折 扣。以中国移动计划在 2025 年实现全网 L4 高阶自治为例,需要汇聚 600 万 + 个 4G/5G 基站、9.9 亿用户和全国“4+N+31+X”数据中心等各类数据,当前核心数据规模已达 650PB,每日还会新 产生至少 5PB 数据。只有将这些分散在不同省份、不同用户、不同应用的高价值数据有效组织起来, 为大模型注入源源不断的数据“燃料”,才能实现 L4 级网络自动驾驶要求的智能基站节能、智能 天线权值优化、投诉智能管理、网络费用稽核等能力,并给出科学的“规、建、维、优、营”的策 略建议。
挑战二:如何降低 AI 开发和运营成本、拓展政企 AI 边缘应用,加速实现运营商 AI 商业闭环? AI 集群是成本和能耗的吞金兽,如 GPT-3 单次训练的电力消耗相当于 500 吨二氧化碳排放 当量,相当于 300 个家庭一年的用电量,而 Sora 的单次训练消耗是 GPT3 的 1000 倍。AI 集群 可用度低造成了算力建设成本高、电力空耗等问题,推高了建设和运营成本。运营商需要考虑从“堆 算力”到“挖潜力”,科学规划智算底座,比如:合理配置存储集群性能,选择高性能、高可靠的 外置存储,提升 AI 集群可用度。 此外,生成式 AI 的商业正循环很重要的场景在边缘应用,尤其在 ToB 政企市场有大量 AI 应 用市场前景,如医疗自助问诊、制造工业质检、金融智能客服、政务办事助手等,这些场景迫切需 要“私域知识库 + 训练 / 推理 GPU+ 检索增强生成 RAG+ 场景化大模型”这样的一体化方案,运 营商需要考虑采用一站式的训 / 推超融合一体机快速推出产品,实现大模型的商业兑现,打通大模 型应用落地“最后一公里”。如中国移动九天超融合信创一体机,为行业用户提供了开箱即用的大 模型服务,搭载 139 亿参数语言大模型以及 10 亿级参数视觉大模型,实现设备检查、皮带堆煤、 皮带异物、煤量识别、人员违章等功能,助力某矿山客户井下安全管控和生产。
3.政务
3.1 服务到治理 : 优化公共办事服务效率,增强公共业务治理能力
牛津智库 Oxford Insights 发布的 2023 年政府人工智慧完备指数(Government Artificial Intelligence Readiness Index 2023),报告对全球国家和地区政府对运用人工智能提供公共服 务的准备程度做出评估,涵盖愿景、治理与道德、数字能力等 10 个维度 42 个指标。其中,数据 是政务领域人工智能演进的关键推动因素,最常见的是语言类数据总量是图片类数据总量的 8 倍, 而当前数据还主要用于客服系统、审批系统、分析决策辅助,并且高收入国家和低收入国家之间在 数据收集、数据应用、数据安全方面的差距尤为明显,这反映了全球数字鸿沟的存在。美国在政务 领域的人工智能应用的得分排名第一,其次为新加坡和英国,中国排名第十六。世界各国纷纷抢抓 人工智能发展的重大机遇,并积极应对人工智能部署于公共服务中所遇到的政策、社会、经济、技 术等问题,强调推行国家级的战略计划将会为社会各界带来变革的契机。

以出入境管理、税收监管、政务问答等公共服务领域为例,AI 正在深化这些场景,服务大众: 1、出入境管理 人工智能能够快速处理和分析大量出入境数据,实现自动化身份验证、智能风险评估和实时数 据分析,预测移民趋势,优化资源配置,简化审查流程。例如,AI 可以通过生物识别技术快速核实 旅客身份,减少人工审核的时间和错误率。同时,AI 还可以分析大量出入境数据,预测潜在的安全 威胁,帮助管理部门提前采取措施。这种智能化的管理方式不仅提高了工作效率,还增强了安全性 和用户体验。 2、税务系统 可以升税务管理的效率和准确性。通过 AI 技术,税务部门可以实现自动化数据处理、智能化 数据分析和风险评估。例如,AI 可以通过自然语言处理技术自动解析税务文件,提取关键信息,减 少人工审核的时间和错误率。实际上,AI 还可以分析历史税务数据,并结合其它类型数据,识别潜 在的税务风险,帮助税务人员提前采取措施。例如,通过比较房地产公司的交易数据和实际税务申 报数据,并结合建筑行业的标准成本数据(水泥、钢筋等基础材料),快速的评估出税收漏报的可 能性。
3、政务问答 各业务部门对于政策的传播、规则的遵从,以及具体案例的咨询,都存在着大量的问询工作。 通过自然语言处理(NLP)和机器学习技术,AI 可以快速理解并回答市民的各种政务问题,提供 24 小时不间断的服务。例如,AI 问答机器人可以在政府网站、微信公众号和 APP 等多个渠道上运行, 随时为市民提供政策解读、办事指南和常见问题解答。这种智能化的问答系统不仅减少了人工客服 的工作量,还提高了信息获取的便捷性和准确性。
3.2共建跨部门数据流动,保护敏感数据,助力政通人和
人工智能在公共服务治理中的应用,虽然能够显著提升效率和服务质量,但也面临着诸多风险 和挑战,例如:实时数据的共享需要确保数据的准确性和及时性,同时避免数据孤岛的形成。其次, 历史数据的激活和利用需要克服数据格式不统一、数据量庞大等问题。最为关键的是,敏感数据的 保护必须得到高度重视,采用加密技术和权限管理措施,确保数据在传输和存储过程中的安全性。
1、实时数据待共享 以中国社会信用体系建设为例,通过数据共享和信息交换,促进社会诚信建设以及对政府各部 门、企业、个人等各种主体的信用评价和监管。针对企业,AI 系统可以实时查看企业的经营状况, 税务记录,环保检测情况等信息,及时发现异常行为并发出预警;针对个人,个性化还款计划:AI可以根据你的财务状况和还款能力,制定个性化的还款计划,帮助你更有效地管理债务,避免逾期还款, 增加信用等级,这些 AI 应用不仅提高了社会信用体系的效率和准确性,还促进了信用体系的透明度和公 正性。因此数据共享和信息交换对于 AI 非常重要,而数据共享和信息交换的基础是数据可视、可管、可 用,这对数据存储提出了高要求。数据存储需要具备高效的数据管理能力:可视——数据资产的拥有者 和管理者,需要对所有的数据有全貌概览,了解有哪些数据、数据的保存地点以及数据量、数据类型等, 相当于维护了一份数据地图。可管——在确定了需要进行归集的数据后,需要有一个机制,来实现基于 策略的数据流动。可用——这意味着原始数据需要被预处理、被转换为 AI 可识别和直接使用的数据。
2、历史数据待激活 全球多国政务机构持续探索基于历史数据提升服务能力,以税务为代表的部委正在积极激活税 收历史数据并应用于 AI,以显著提升税务管理和决策的智能化水平。辅助政策制定——不同地区的 经济发展水平和税收基础不同,AI 可以分析同一政策在不同地区的效果,帮助政府制定更具针对性 的区域税收政策。评估政策效果——通过分析过去 5 年的税收数据,AI 可以评估某一税收政策实 施前后的税收收入变化。某一减税政策是否真正促进了经济增长,增加了税收收入,还是导致了税 收流失。预测政策结果——假设政府颁发一种税收优惠政策,通过对相关历史数据的分析,AI 可以 预测未来几年内该税收优惠政策给特定行业带来的投资影响和发展变化。AI 对于历史数据需求,超 乎了我们的想象,这对数据存储的读取速度提出了极高的要求。为了满足 AI 模型的快速训练和实 时推理,存储系统必须具备超高的读取速度,以便迅速访问和处理海量数据。这不仅要求硬件层面 的高性能存储设备,如 NVMe SSD,还需要优化的数据管理和缓存策略,以确保数据能够以最快 的速度被读取和利用。
3、敏感数据待保护 公共服务领域涉及到大量的关键敏感数据,例如出入境管理涉及到敏感数据包括个人身份信息 (如姓名、出生日期、护照号码)、生物特征数据(如指纹、虹膜数据)、旅行记录(如出入境时间、 地点、航班信息)、签证信息等。AI 技术虽然提升了数据处理和分析的效率,但也带来了数据泄露 和滥用的潜在风险,特别是在跨境数据传输过程中,敏感信息可能会被不法分子利用。因此建立公 共数据管理制度和技术手段必不可少,而作为数据安全的最后一道防线,数据存储起着至关重要的 作用。数据加密——所有存储的数据必须进行加密处理,以防止未经授权的访问和数据泄露。访问 控制——严格控制对数据的访问权限,确保只有经过授权的人员才能访问敏感数据。数据备份—— 定期进行数据备份,确保在数据丢失或损坏时能够及时恢复。日志记录——记录所有对数据的访问 和操作日志,以便在发生安全事