数字员工3.0的三大支柱是什么？

提问时间：2024/11/18
浏览次数：156
提问者：匿名用户
举报
分享微信 QQ 微博

数字员工3.0的三大支柱是什么？

标签

数字员工

共有1个回答
关注问题
我来回答

最佳答案由匿名用户编辑于2024/11/18 16:41

技术融合，夯实数字员工智慧基石。

1.算力：异构算力融合，按需开展算力利用和建设

大模型作为数字员工3.0的智力基础，其参数量的激增对算力基础设施提出更高的要求，大模型全面体系化的建设需要大量资金投入和高技术门槛，各类型金融机构应结合自身发展制定基础设施发展策略。一是对于大型机构，建议加快推进新一轮算力规划和布局，开展面向通用人工智能的大规模算力技术设施规划与建设，根据“绿色低碳、高效协同、云智融合”的思路统筹规划，构建企业级智算中心。 ·绿色低碳：打造符合国家“双碳战略”的绿色新基建，短期内，考虑到液冷机房建设周期长，优先采用高密风冷机柜部署风冷AI算力服务器模式推进建设；中长期来看，目前，AI算力服务器随计算能力增长带来单机耗电功率快速增长，传统风冷技术难以满足制冷需求，液冷技术因其更高的热传导性能和更低的能耗成本，成为智算中心散热的必然选择。

高效协同：大模型的训练和推理通常需要多卡甚至多机运行部署，需要使用高性能AI服务器、RDMA高带宽网络、多级高效存储系统等设施，组建规模在千级AI算力芯片及以上的算力集群进行大模型训练和推理，推动算网存高效协同赋能，建设高效的大模型算力集群。 ·云智融合：硬件层面，支持IaaS弹性部署，具备云化资源池化供给能力，支持CPU、GPU、NPU、MLU等异构AI算力混合部署，形成大规模异构算力集群，支撑不同场景的AI任务算力需求；软件层面，基于 PaaS容器化能力，通过云化算力调度引擎支持AI算力的池化调度、弹性伸缩和存储加速等能力，实现AI算力的统一调度，并利用算力虚拟化技术提升算力利用率；运维层面，形成资源统一纳管、统一监测、统一运营的标准化流程，支持分租户资源隔离、训练推理集群资源隔离，并建立故障快速诊断、故障预测预警、断点续训等能力，满足AI算力大规模集约化应用。

二是对于中小机构，可优先建设推理小集群满足业务应用，并视金融场景适配情况建设小规模的训练资源满足模型微调需求。这种算力部署模式相对轻量，面向实际应用需求，优先支持物理机形态或PaaS小集群模式，灵活部署相关数字员工应用的AI服务能力，快速赋能。同时，轻量化设计意味着集群可以快速扩缩，可快速适应不同的工作负载和业务需求。

2.算法：多样智能融合，赋能数字员工生产力跃升

1、传统小模型与大模型并存共进，“选、育、用”三维发力模型能力建设金融业务场景复杂多样，涉及多任务、多时效等要求，单一的大模型虽然知识面广，但难以全面覆盖各类应用需求。大模型和小模型各有优劣，以生成式AI为主的大模型具有“大而强”的特点，性能强大且有很好的泛化能力，但在训练部署灵活性、结果可解释性、反应速度方面尚有提升空间；以判别式AI为主的小模型具有“小而美”的特点，尽管泛化能力弱，但具有轻量级、高效率、易于部署优化等优点。因此，在数字员工3.0的构建中，需要充分考虑大小模型的融合，通过模型选型引进、训练优化、共建应用三个维度，融合“多样智能”，建设数字员工3.0的全能算法库。

2、“选”：紧跟技术发展，持续引进先进模型 2023年以来，国内外头部科技公司竞相发布大模型，形成“百模大战”的业态格局。为保持大模型能力的持续领先，银行机构应建立大模型的持续优化与科学选型机制。一是建立金融大模型能力测评标准测。从技术能力、应用能力、安全可信能力等维度，面向通识理解和金融实际应用，建立涵盖世界通识、金融行业通识、金融专业认知、实际金融应用任务的金融大模型能力测评标准，做到能力测评有据可依。二是持续建设完善、丰富的测评数据集。根据业务场景特点，建设覆盖文本、语音、视觉、图文多模态等模态，包含理解、记忆、仿真、问答、生成、推理、计算、调控、安全等方面的面向商业银行具体业务的金融测试集，并建立测评数据集常态化更新机制，支撑模型能力选型。三是构建自动高效的模型选型测评流程。通过自动化评测工具，自动评测大模型，并通过大模型辅助审核方式提升测评效率。

3、“育”：建设多模型能力协同矩阵，持续优化模型效果通过打造多维度大模型矩阵，形成全面、灵活、高效的模型发展路径，针对不同场景提供定制化解决方案，提升模型在金融各个细分领域的表现。以工商银行为例，构建横向多模态/多参数，纵向多层次、大小协同的金融千亿级大模型算法矩阵，满足不同场景的模型应用需求。

1）纵向多层次模型一是在通用模型基础上训练行业/企业大模型。行业/企业通用大模型要求“大而全”，即模型参数规模较大，能力多样，能够满足金融行业通识知识问答、数据分析、财报分析等涉及海量金融知识、难度较大场景的需求。训练策略方面，通过引入大量金融领域专业数据和知识，对能力优秀的基础通用大模型进行针对性二次训练，形成具有深度金融知识理解能力的行业大模型，并在此基础上融入企业特有的知识数据，训练形成企业专属大模型。二是针对企业特定场景，在通用/行业/企业大模型基础上进行垂直领域或任务模型的构建，扩展模型的专业领域覆盖面和任务处理能力。面向特定领域或任务，模型能力要求“小而精”，即能够在特定领域和任务上提供精准、高效的服务，并能满足高并发下的推理性能要求。训练策略方面，通过模型蒸馏、微调、数据蒸馏等方案，在对客服务、金融市场等特殊的垂直领域或具体任务，打造专精的垂直领域或任务大模型，保证在专项任务效果的同时节省算力资源开销。

2）横向多模态多参数模型针对不同的任务，需要调用不同模态、不同参数的模型满足需求。多样模型协同的数字员工才能够更好发挥场景价值。一是以多类模型协同实现能力互补，提升整体运行效率。例如，自然语言处理大模型擅长语言理解与生成，具备问答、文案、编程等多功能，适用于金融制度/操规问答、营销话术生成、财报分析等金融文本理解/生成类场景。预测大模型专长结构化数据的聚类、分类、回归，适用于客户流失预测、资金流预测等决策分析类场景。多模态大模型融合文本、图像等数据，理解跨模态信息，适用于包含大量电子影像文档的信贷智能审核、远程银行通话语音质检等场景。

二是根据应用场景需求，选择相应参数规模的大模型。传统小模型适用于需要强解释性的场景，十亿、百亿级参数满足低时延、低成本推理需求，适用于知识问答、摘要生成、数据分析等场景。千亿级参数大模型，能力较强，适用于复杂分析任务，同时可生成合成数据供其他模型做数据蒸馏增强训练。银行机构应根据自身情况制定响应的模型能力建设策略。对于数据充足、场景丰富、技术能力强的大型银行，可参考建设全体系模型能力。对于中小银行，短期内可采用金融知识库+基础通用大模型融合应用模式，快速满足知识问答等通用场景应用需求，中长期，随金融业务数据积累、技术应用能力增强，可考虑针对特定领域进行大模型的二次训练或微调，进一步适配场景广度和深度。

4、“用”：降低模型使用门槛，打造协同生态随着大模型技术逐步成熟，大模型逐渐进入规模化应用阶段。为让大模型能够更好地适配场景需求，应从模型推荐、高效研发、易学易会等方面降低使用门槛，打造协同生态。一是按场景进行模型的适配和推荐。在已建成大模型矩阵的基础上，建设模型调控引擎，根据各场景的不同需求，推荐合适的大模型。同时，提供包括OCR、语音、知识检索、文档生成、数字人等不同AI能力的沉浸式体验，从拟人化组合成人的视角，促进应用。

二是建设开放的高效微调流水线。面向差异化场景，应用推广中逐步开放大模型微调能力，综合考虑算力消耗和场景价值，建议优先利用LoRA等高效微调技术构建支持文本、图文多模态等大模型建模流水线，加强对特定场景的模型适配能力，降低建模资源整体消耗。同时构建高效的推理方案，实现同一基座大模型挂载多个LoRA模型的高效推理，支撑长尾场景高效推理。值得一提的是，LoRA是一种高效的微调方法，它通过在预训练的大模型中引入少量的低秩网络层来实现。这些额外的层具有远小于原始模型参数量的参数，允许模型在保持大部分预训练权重固定的同时，通过训练这些新增的参数来适应特定领域的数据。通过该模式，LoRA可以将需要训练的参数数量减少到原模型的千分之几，大幅度减少所需的计算资源和内存占用，使得对大模型的微调变得更加可行和经济。

三是构建易学易会的大模型知识体系。围绕模型接入、提示词优化、模型选择、模型微调、模型上线等常见问题构建完整的知识体系，并搭建自动化的选择和问答工具，降低大模型使用门槛。

3.数据：全模数据融合，激活数字员工认知核心

商业银行数据呈现形态多模化、质量多维化、内容多元化、来源多样化等特点。为夯实人工智能的数据基础，一是建立企业级金融数据知识体系，对内丰富模型训练数据，对外建立金融专项知识库，内外协同，提升数据的可获得性和利用性。二是建立智能化的非结构化数据治理能力，在结构化数据治理的基础上，进一步盘活海量非结构化数据资产。

1、“5+1”架构数据知识体系，增强数据的可获得性和利用性为更好积累沉淀高质量、多维度、海量的金融数据，各银行机构可从“基础-行业-企业-领域-任务”五层模型体系及外挂知识库增强诉求入手，配套建立“5+1”金融大模型知识工程体系，提供各类知识分层管理、新旧迭代、内容可信监测等能力，确保数据的多样性、通用性和准确性。一是建立世界-行业-企业-领域-任务五层知识架构，灵活纳管全领域、全模态金融数据。同时，分层训练对应类型的大模型，通过二次训练+微调实现金融知识高效继承复用，增强各类模型的金融认知能力。其中，世界层，集成全球资讯、百科等通用知识，提供宏观视角；行业层，专注金融行业数据，如监管政策、企业财报、投研分析等，提供行业视角认知；企业层，细化至银行内公共数据，包括资讯、公文、业务知识，提供企业视角统一认知；领域层，针对金融具体专业业务领域沉淀专业知识，其中，建议针对对客服务知识进行统一归口建设，避免二义性；任务层，针对具体金融任务，沉淀场景定制化知识数据。

二是实时更新的外挂知识库，为大模型提供知识“外脑”。外挂知识库通过实时数据流和自动化更新，保持信息时效性，结合细粒度访问控制和安全措施，确保数据安全。利用检索增强生成RAG技术（Retrieval-augmented Generation）将大模型与语义检索以及向量数据库结合，满足内容精细化检索的需求。同时，通过Graph RAG进一步提升对文本语料库的全局理解，实现基于知识图谱的检索增强。

2、4种智能化数据治理能力，盘活非结构化数据资产结合工商银行大模型数据工程实践，本文建立利用AI4Data技术从数据“采集、清洗、管理、应用”四方面提升非结构化数据处理生产效率，盘活非结构化数据资产。

一是夯实数据采集之“基”，打破数据孤岛。对内，通过建立企业级数据中台方式，形成统一集中纳管的数据资产。对外，通过开源加联创、专项采购等方式，持续丰富通用的互联网新闻、书籍等外部数据。内外结合，建立数据的全面采集机制，为金融大模型的构建引来源头活水。同时，利用合成训练数据技术，为填补数据缺陷提供创新路径。银行机构可以探索利用生成式AI技术合成训练数据，重点强化对合成数据的生成技术、质量评价能力和效率。合成数据可以作为现有文本数据集的有效补充，全面提升智能金融应用的效果。

二是持续提升数据处理清洗之“器”，降低数据处理门槛，提升质效。建议通过建立专家清洗规则库+多种智能清洗模型方式，解决异常值等常见数据质量问题，并满足内容矫正补齐等复杂数据清楚处理诉求。同时，考虑到大模型的金融微调数据人工投入大、标注难度大等痛点，建立基于大模型的AIGC辅助标注能力，智能生成文章、观点、逻辑链等复杂标注数据，辅助人工提升效率。通过AI提升数据清洗能力，有效消除数据冗余、清除数据偏见，确保数据的质量和准确性，并通过工具支撑，持续扩充金融专属数据集，以便完成企业内专有模型训练。

三是加强训练数据的高质量管理之“术”，守牢大模型数据合规安全。重点增强知识冲突检测能力建设，可训练智能专项模型提供知识相似度、矛盾等监测能力，并制定知识质检标准，建立业务+科技双审核机制，提供各类知识新旧迭代、内容可信监测等管理能力，避免知识重复、冲突。同时，重点加强大模型数据安全管控，在数据安全管控过程中，优先保障社会主义核心价值观、金融从业要求、企业文化，通过敏感词检测、非法数据过滤、安全测评、人工审核等处理安全手段，提升数据质量和安全可控能力。

四是建立数据应用的运营之“道”，实现大模型的数据闭环。训练阶段，通过十亿模型数据最佳配比，推断百亿、千亿大模型的数据智能配比推荐，解决百亿、千亿大模型多样化数据配比难度大的痛点，提升性能。应用阶段，建立以业务场景为单位，大模型迭代为目标，通过规范运营埋点数据、建立运营团队、持续分析bad case、优化模型等方式，确保大模型应用的数据运营闭环，推动大模型持续优化。

参考报告

大模型驱动的数字员工3.0建设应用白皮书：发展新质生产力开启数字金融新纪元.pdf

大模型驱动的数字员工3.0建设应用白皮书：发展新质生产力开启数字金融新纪元。大道不孤，众行致远。习近平总书记多次作出重要论述，指出发展新质生产力是推动高质量发展的内在要求和重要着力点。这是在世界百年未有之大变局和中国现代化建设的新阶段，对高质量发展的把脉定向。中央金融工作会议要求，金融要为经济社会发展提供高质量服务，做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章。银行业应全面深化数字技术的金融应用，以人工智能为重要抓手推进产业创新和解锁新质生产力，以高质量金融服务推动经济高质量发展。因时而变，随事而制。数字员工3.0作为人工智能大模型与银行业务深度融合的新型业务应用载体，正在重...

查看详情

数字员工3.0的三大支柱是什么？

1.算力：异构算力融合，按需开展算力利用和建设

2.算法：多样智能融合，赋能数字员工生产力跃升

3.数据：全模数据融合，激活数字员工认知核心

大模型驱动的数字员工3.0建设应用白皮书：发展新质生产力开启数字金融新纪元.pdf

数字员工未来前景分析

如何构建数字员工智能安全合规框架？

如何构建数字员工管理体系？

数字员工3.0研发模式分析

数字员工3.0建设挑战有哪些？

数字员工3.0的优势体现在哪？

为什么说数字员工是数字金融的重要应用载体？

商业火箭目前发展到什么阶段了？

康耐特光学有哪些业务布局？

AI眼镜行业规模、需求、成长性、格局及竞争要素在哪？

康耐特光学发展历程、股权结构及收入分析

中宠股份经营看点在哪？

中宠股份发展历程、股权结构及营收分析

赛微电子发展历程、股权结构、主营业务、研发及财务分析

梦百合内外销业务进展如何？

沃巴查芒

每日新报

StartYourFinance

999感冒灵

王中王