想要构建好智算人才培养体系,首先需要理解智算人才学习特征。下图所显示的四条学习曲线代表个 人所掌握的不同知识类型,对比的是知识与数智技术的相关性及有效期,所呈现的是知识的衰减率。
1.人才规划:组织的五者智算战略定位与智算人才定位的握手
先前所描述的生态五者(全栈自建者、模型自优者、应用自架者、纯粹应用者及服务提供者),概括 了生态参与者在智算发展各阶段会涉及的角色。五者不仅映射了各类参与者的智算战略定位和资源投 入方式,也指导了企业在明确自身定位后,如何围绕特定业务场景去执行智算战略。而执行战略的最 大驱动力,归根结底依赖于组织的人才。

为了评估组织人才的成熟度,企业需要从多个关键要素进行考量,包括组织领导力、模型、数据及算 力。通过这些要素的综合评估,企业能够识别面临的主要挑战,分析问题的根本原因,并制定相应的 解决方案。这些方案应与组织的人才战略紧密结合,确保战略与执行的一致性。 举例来说,一家专注于人工智能研究的企业,可能将自己定位为智算服务提供者,专注于模型研究的 深入探索。在对自身的算力资源、数据积累和模型算法能力进行细致评估后,可能识别出对人工智能 框架算法研究员或数据科学家的迫切需求。而另一家智算纯粹应用者企业,则可能更多地考虑如何将 这些服务和产品有效地集成到自身的业务流程中。这要求企业从团队构建的角度出发,思考如何通过 组织架构和人才配置来优化大模型技术的应用。 在这些情况下,组织的战略定位必须与其人才战略相互协调,以确保智算的发展潜力得到充分发挥, 同时推动组织在竞争激烈的市场中保持领先地位。
2.人才培养:智算人才培养模式与迁移路
2.1 培养模式:构筑“观全局,有远见”的智算人才“望远”培养模式
智算的广泛应用,及大模型在千行百业的应用中,特别强调工程化融合能力,这背后揭示了算力集群、 行业算法,知识和数据工程等要素要真正在行业产生应用价值,需要通过适配层和工具化,以及形成各 类工程和业务范式以提升算力、数据的转换效率,也降低训练、模型部署和推理应用的技术门槛,这需 要技术与业务围绕智算核心要素的深度融合。工程化融合能力带有复合技能的阶梯型培养模式,是强调 需要业务与技术能力的相互融合渗透,才能做好工程类的职务,如数据工程、知识工程、模型调优、应 用部署和提示工程等。当技能掌握到一定程度,就需要其他方面的注入来提升工艺水准。所以阶梯型是 也是代表了融会贯通其他学科领域的过程,如哲学、心里学、经济学等。当达到一定累计有突破了,技 能也就往更上一层攀升。图中,技术人才与业务人才的发展轨迹在工程领域交汇,形成了一条通往融合 能力发展的路径。这一过程表明,往往起始于技术或业务的单一维度发展,随着职业生涯的深入发展, 因应工作需求的复杂性和个人职业发展的内在驱动,逐步涉足更为广泛的领域。过程中,原本专注于技 术领域的人才可能会逐渐融入对业务流程、市场需求的理解,而业务领域的人才则可能开始掌握技术实 现的知识和技能。这种跨界融合的趋势促使他们发展成为既懂技术又通业务的复合型人才,在项目的工 程工作中也能发挥桥梁作用,促进技术解决方案与业务目标的有效对接。 不同的组织人才类型需要不同的培养模式与成长路径,对齐三相传导人才结构,在设计人才培养路径 的时候,可以注入智算的特征及人群的需求。

战略管理人才培养模式:作为组织的领军人物,他们更多需要高精尖的培养,提升格局,开阔视 野,成为有远见、有思想力的战略性人才。这种类型的培养不求深度但强调对业务面与技术面覆盖 有宽度,能洞察智算对本行业与组织业务的影响,推进智算在组织中的应用。 • 业务人才培养模式:需要掌握大模型技术对一些典型行业的应用,行业大模型的解决方案设计。这 种类型的培养就需要对业务应用有广度,可涉及些许技术层面的知识来支撑与技术人员的沟通但无 需太深入。 • 技术人才培养模式:算法层面需要掌握模型训练开发与人工智能应用,基础设施层面需要提升算力 平台分层分级能力。这种类型的培养需要循序渐进往深层技术领域去钻研。同时业务方面也能有些 基本的对应用需求和技术转化需求的了解,以更好支撑业务需求。
华为公司自身的智算人才培养就是通过项目经理/业务架构师/方案架构师/技术交付4类人才进行基 础、进阶、专业和专家4个阶段的四方体培养矩阵。先遣队的培养关键在于把来自不同业务部门、不 同背景层次的团队成员快速聚集赋能,让他们能迅速投入到项目中。
2.2 迁移路径:智算角色迁移路径
前面介绍了智算三相传导人才结构以及对应的三相人才子类,同时也从企业价值流中去解读相关的典 型智算角色。我们将这些角色进行了归类,然后针对业务类角色与技术类角色做角色也给出了迁移路 径的分析。
智算大模型时代,企业员工需要快速构建开展智算业务所需的能力,为企业在新时代的发展提供人才 基础和发展动力。智算业务角色按能力模型可以划分为基座型角色、知识型角色、应用型角色、技术 型角色、工程型角色、运营型角色和销售型角色七类,企业在审视当前员工时可基于现有技能、经验 的基础上,通过掌握智算领域的新技能,转身成为智算业务所需的未来角色。各类角色的成长路径说 明如下: 知识型角色应要具备数据工程规划,数据采集、数据清洗和预处理、数据标注、向量知识库构建和数据 安全与治理能力。企业现有的数据工程师通过掌握数据治理、ETL等技能后,可以转身为面向人工智能 的数据工程师;业务专家则利用自身熟悉业务的优势,转身为语料工程师,负责数据语料准备、知识管 理和知识工程等工作。他们一起为大模型训练提供高质量的训练数据,并进一步成长为数据科学家。
应用型角色应具备智算产品思维和意识,识别使用人工智能的业务场景,掌握专业智算和生产经验, 具备智算业务流程设计能力。企业现有的业务专家通过掌握人工智能场景选择和产品设计能力,可转 身为应用架构师和人工智能解决方案架构师,负责智算大模型新业务新应用的创新和方案设计。 技术型角色应具备大模型算法开发、模型微调、模型部署和应用编排能力。企业现有的算法工程师、 开发工程师等技术角色,通过掌握相关技能,可转身为模型算子工程师、模型训练工程师和人工智能 应用部署工程师等人工智能大模型训练的技术型角色,负责模型设计、模型训练、模型推理、人工智 能应用开发和部署等工作。

工程型角色需要在预训练完成的大模型基础上,通过提示工程、数据工程、应用调优、应用评估等工 程手段,提升大模型的实用性,让大模型的输出更加的准确,能在业务中有效落地。企业现有业务人 员和应用用户,在掌握提示工程、应用调优和应用评估等技能后,可转身为应用调优工程师,和人工 智能应用运营工程师一起,对模型进行优化,提升模型输出质量。 运营型角色负责人工智能应用上线后的运营。掌握业务知识的多少,是人工智能模型能否准确回答问题的关 键。因此人工智能应用上线后,还需要通过知识运营、数据运营和API治理等工作,为人工智能应用不断提 供和更新企业业务知识,促进模型能力不断进步。企业现有业务人员和应用用户,通过掌握知识管理和人工 智能应用运营能力,可转身为人工智能应用运营工程师,负责KMER知识工程和人工智能应用运维等工作。 销售型角色在现有销售能力基础上,熟悉智算技术及业务基础知识,掌握智算产品与行业场景应用, 具备智算业务行业洞察、方案开发和销售能力。 基座型角色在现有数据中心建设和运维能力的基础上,掌握算力底座算、存、网的产品的特性和操 作,具备算力平台建设和运维能力。下图将深入探讨此角色类型的路径。
算算力底座聚焦于“建”的概念,除了是底座的建造,也是使能模型发展的重要驱动力,呈现出贯 通能力的角色将是趋势。因此,智算基座型角色可分成基建型、集群型及调度型角色来支撑算力底座 的规建维营,以及使能型角色来负责模型适配,并推动人工智能开发框架的使用与发展。 基建型角色负责数据中心的整改与适配,进行DC L1与L2方案的联合设计规划。智算是个非常新的场 景,现有机房无法满足智算的需求,因此需要进行大量的机房改造。与此同时,智算场景下的DC L1和 DC L2联系异常紧密,需综合考虑两者的节奏与技术方案设计。L2的产品设计会牵引L1的改造方案,所 以L1与L2需要综合考虑每个细节的设计,避免后续变更或返工。L1机房改造主要涉及到机房内的综合 布线、供配电与动环系统、房内设备冷夜、地板承重及洁净度等因素。因此基建型角色也是个融合型 角色,兼顾DC L1和DC L2的能力,是现有DC L1工程师转型的首选。
集群型角色是对DC L2的算存网多域产品进行联合方案设计与交付。掌握基于算力场景需求对DC L2 的算、存、网进行规建维优营工作,是现有IT Infra工程师或IP工程师转型成为算力平台工程师的第一 步。第二步是掌握集群部署与集群维测。智算的超级集群组网方案涵盖计算、存储、网络协同,涉及 多个网络平面设计,复杂度高。集群的安装、压测、联调涉及环节多,过程复杂,需要专业工具使 能。来到运维阶段,计算、存储、网络跨域运维也是非常复杂,故障定界、定位难度大,耗时高。因 此掌握这些跨域产品的设计与工具的使用是关键。 调度型角色顾名思义就是基于云化管理平台进行算力调度,以及人工智能基础软件与硬件的适配。算 力的调度是通过算力集群调度,任务下发需要在分钟级内完成,要根据训练作业特点进行亲和性调 度,保障网络的负载均衡。因此,现有的云工程师转型成为云管理调度平台工程师,除了掌握云底座 的规建维优也需要训练平台部署能力,集成TOR亲和调度算法,实现网络流量负载均衡,实施GPU/ NPU集群调度与训练的断点恢复。因此,考验云管理调度平台工程师的软硬件协同优化,保障全栈系 统级容错的能力。
使能型角色则是支撑并推动人工智能开发框架的使用与发展。按照作业流,可划分前后端作业界面以 及所需关键能力项。技术支持工程师是使能型角色的最佳代表,需要有资深的产品知识和产品实际应 用技术,聚焦工程工作如系统对接、模型迁移、精度对齐、加速调优、数据治理、模型微调及推理等 工作,为的是去支撑客户使用人工智能软硬件和构建生态。由于需要技术背景,云管理调度平台工程 师横向迁移至技术支持工程师是个发展路线。 随着技术发展,结合底层大模型、模型迁移与算子实践,关键的模型训练技术服务将沉淀转化为模块 供平台调用,使能技术支持工程师能力前移,逐步往业务层的角色迁移。
2.3 人才评估:智算人才认证与评估体系
智算人才的认证与评估体系是一个较新的课题,智算领域因为其产业成长性、技术栈的复杂度和智算 领域对人才需求的复合型,所以其认证与评估体系的构建需要从人才需求、岗位分析、技能分析以及 扩展因素等方面综合分析。
3.1智算人才认证与评估体系的构建
(1)智算领域人才需求分析 作为关键的输入,按照智算领域大模型渗透率维度对不同类型岗位人才的分布进行分析,结合典型岗 位的职位描述(JD)进行人才需求提炼。

(2)智算领域人才岗位分析 智算人才岗位按照智算技术栈“底座层”、“平台层”、“模型层”及“应用层”展开,包含以下三 类场景下的岗位需求: • 人工智能原有岗位,技能需求有变化 • AIGC催生的新工种 • AIGC增强职位 岗位需求的宏观分析是厂商认证和评估体系建立的重要输入,需要根据厂商的产品/解决方案及业务范 围确定具体的岗位目标。 (3)智算领域技术能力分析 智算大模型技术能力集以智算大模型四层的关键技能出发,对岗位需要的技能进行拆解重组以适应认 证与评估分方向分科目的架构设计的需要形成一张左右映射的“岗位-技能”关系网,如图中①-③示 例。同样,需要结合厂商的产品/解决方案及业务范围确定技能目标,并根据具体需要进行JTA(Job Task Analysis)分析。
(4)人工智能专家人才培养系统工程因素 基于人工智能大模型的项目作为一项复杂的系统工程,需要多个领域的人工智能专家协同,从专家 人才的培养的角度提出了人工智能专家人才成长系统工程的“四个视图与通用技能”。系统工程因 素可以对步骤三分析的“岗位-技能”关系网进行筛选,选取“业务架构师(BA)+ 解决方案架构师 (SA)”、“开发者(人工智能训练工程师、人工智能应用开发工程师、算子开发工程师、模型部署 工程师等)”、“TD(硬件实施工程师、设备调测工程师、运维工程师等)”这样的三个方向进行认 证设计,详细的认证设计环节不再展开。
(5)人工智能专家人才培养系统工程因素 综合分析,面向智算人才的认证与评估体系的构建需要根据评估方的产品/解决方案覆盖的领域或技术栈 的分层构建: • 人工智能领域:作为智算的核心领域,评估的对象大致分为技术人员和业务人员。 • 技术人员:平台型企业注重开发者生态的构建,按智算技术栈自下而上,可覆盖平台层、模型层、应 用层的人工智能开发者能力的评估,需要在所在方向从事人工智能应用开发、模型开发、算法开发、 算子开发等实际技术工作。举例:基于深度学习训练框架的模型开发认证、基于人工智能应用开发框 架和算子开发平台的推理应用认证。 • 业务人员:人工智能领域业务人员常见的有售前、销售、人工智能产品经理等。此类人群关注客户视 角需要解决的业务问题,逐层分解业务场景到人工智能的应用场景、应用范式,基于掌握的人工智能 项目端到端的业务流程和基础的人工智能技术原理,可以进行算力平台、基础模型、行业模型、场景 模型的选型,可以进行人工智能应用的验收。举例:人工智能解决方案架构师认证,可从业务架构 (BA)、解决方案架构(SA)视角主导人工智能项目的业务分析、技术选型并最终推动项目落地。
ICT基础设施层:作为智算的核心领域,评估的对象涵盖“计算”、“存储”、“网络”等ICT基础设 施的运维人员。覆盖的能力主要包括,在传统“算、存、网”的基础上因应智算的发展,当人工智能 集群在数据中心部署后对“算、存、网”上叠加的新业务能力或场景的维护能力的增强。举例:数据 中心网络运维工程师认证。 • 基础软硬件层:作为智算的相关领域,侧重操作系统、数据库等基础软硬件等系统管理人员的长期发 展,也因应智算的发展,在复杂的系统环境下对系统管理要求有所增强。举例:openEuler操作系统/ openGauss数据库的系统管理员认证。 • 云平台云服务层:作为智算的相关领域,传统的“建云”、“用云”和“管云”的云化业务场景,也 会因应智算的发展,在私有云/混合云的构建、公有云智算相关业务的提供上都有增强,为智算大模 型的模块开发、模型应用提供了算力保障,进而带来云平台云服务领域工程师的能力评估的升级。举 例:云计算/云服务工程师认证。 智算领域的人才认证与评估体系的构建是一个动态发展的过程,随着人工智能技术的发展需要跟随岗 位、技能要求以及必要的工程要求持续迭代。
3.2 智算领域认证体系的运用
智算领域认证体系可以在如下场景运用: • 厂商内部的任职资格体系的建设:售前、销售、服务等岗位的中长期的任职资格体系 • 智算项目人才资源的储备:按照岗位角色轻量化的培养和评估岗位角色,如:PD(项目负责人)、SA (解决方案架构)、TD(技术负责人)、FAE(模型及人工智能应用开发)等 • 人才生态构建:构建包含客户、伙伴、院校、公众等的智算人才生态体系 企业所处的智算领域的分层位置以及企业智算相关团队的规模也是智算领域认证运用的参考因素,比如 有一定人工智能研发储备需要长期储备模型及人工智能应用开发能力的会更多选择AI-开发者方向;倾向 于外部采购模型AI应用开发服务的企业会更倾向于基于在其行业专业知识的基础上通过AI-解决方案架构 的技术选型和产品管理验收等能力补齐短板;而销服体系的伙伴则会考虑在原有数据中心运维能力上补 齐智算需要的“算、存、网”的能力。