云计算行业有哪些转变?

云计算行业有哪些转变?

最佳答案 匿名用户编辑于2023/07/31 13:58

云计算正向数字世界操作系统转变。

(一)数字应用方式与算力资源供给的变革,推动云计算作用转变 。人工智能大模型的快速发展,引发数字应用使用方式和算力资源供给的双向变革,加速了云计算向面向大体量分布式应用体系化、工程化创新的操作系统演进。

向下来看,算力资源呈现出计算异构、算网融合的特点。以GPT-4 为例,其模型训练借助公有云能力在通用CPU的基础上整合上万个 GPU 芯片,通过云计算平台实现GPU 集群和CPU集群的标准化封装,保障训练任务可以直接下发到大规模计算集群。同时在数据处理方面,模型训练涉及 PB 级的存储数据集、中间结果和训练好的模型参数等,且数据类型各异,也需要云计算平台提供的存储方案,实现复杂数据的统一调度和处理。计算芯片多样化、异构数据复杂化也加速云计算向能够一体化调度、处理计算、网络、存储资源的操作系统方向演进。

向上来看,数字应用呈现出分布式、多模态、超大量级的特点。以 ChatGPT 为例,ChatGPT 的模型参数已达千亿,且模型训练数据涉及文本、图片、音视频等多个模态,基于分布式训练框架实现了超大规模量级的并行计算,这对部署模型的云计算平台提出新的需求。云计算的焦点不仅仅在提升单点应用的研运效能,更要发挥出面向大规模分布式应用协调、分发、部署的中枢管控能力。模型构建的复杂性限制了技术的普惠发展,基于云计算构建开箱即用的大模型服务也成为刚需。

(二)云计算管理方式不断革新,向下定义算力资源使用新方式。 云计算技术的出现和成熟,如今已经不局限于算力资源的云化,更是向网络、存储等多维度资源云化进行延伸,同时通过纳管、编排、部署等管理方式的不断升级,在算力资源的接入、调度和分发等方面产生新的促进作用,具体表现为:

接入方面,云计算纳管能力持续加强,使多样性算力资源提供成为可能。传统数据中心以提供通用算力为主,随着科学计算、自然语言处理、视频渲染、知识图谱等计算需求的增长,通用算力资源已不能满足这些超强计算型应用的需要,而云计算逐渐发展出多样性算力资源池的能力,高性能计算云平台(HPC)、FPGA云主机、GPU 云主机、智算平台等多样性算力资源均通过云的方式统一接入,极大地丰富了科研机构、企业、高校以及个人触达算力的便捷性与普惠度。同时,东数西算、大模型训练等场景带来了多样性数据,也催生了可高效满足不同业务诉求的多性化计算架构,如ARM、RISC-V 等通用计算技术路线,以及 GPU、DPU、NPU等融合架构计算平台,云计算使得不同架构、不同类型算力资源的统一感知、调度成为可能。例如,阿里云飞天平台通过公共云或专有云模式,可运行在多种芯片类型的服务器上,支持多种处理器混合部署、统一调度,为用户提供计算服务;天翼云云骁平台将通用算力、智能算力、超算算力融合在一起通过云的方式提供,使用户可一站式获取多样性算力资源。

调度方面,云计算编排能力不断升级,使算力资源跨区域跨架构调度成为可能。一是云计算资源池化技术为物理资源池提供算力规模弹性空间,支撑算力调度模式由“按量”发展为“按需”。传统算力调度模式,多以算力规格作为调度内容。云计算资源池化技术实现算力资源根据用户需求动态分配,充分满足用户多样算力使用场景。二是算力资源使用时,调度要素由“单一类型”走向“复合类型”。传统算力调度要素仅考虑算力这种单一类型资源的调度,云计算中虚拟化技术使得算力、网络、存储等多种资源可在同一个应用场景下被协同管理、编排、调度。例如,电信运营商依托网络基础设施优势,综合评估算力、网络、存储等复合资源状态,推出能够提供融合统一调度服务的“算网大脑”,通过实现“算”和“网”资源的拉通、编排调度层的拆解、标识、感知、映射等能力,结合调度算法,提供算网融合类的业务支撑。三是分布式云技术推动算力资源全局调度能力发展,实现算力调度跨域融合。在传统调度方式中,单一的云平台由于调度范围有限,难以满足算力随取随用的需求,导致算力资源的全局调度能力受限。随着分布式云的发展,产业逐步演变出基于云边端的分布式操作系统,它能够实现跨地域算力资源互联互通,具备多层级算力资源的统一纳管、智能调度、全局优化等能力。当前,电信运营商、云服务商已开展跨域算力调度能力的建设,如曙光参与推出“一体化算力服务平台”、天翼云发布“息壤”算力网络分发平台等。此外,各地方政府也开始自发建设算力平台或调度中心,如北京算力互联互通验证平台、上海市人工智能公共算力服务平台、粤港澳大湾区算力调度平台、甘肃算力资源统一调度平台等。

分发方面,云计算声明式部署方式推动算力资源分发模式新变革。传统的算力分发方式是面向流程的,以分发命令为核心,分发结果取决于分发命令的精确程度及执行程度。传统分发方式下,算力资源主要依靠运维团队手动部署和维护,一个机房的搭建通常需要 4 人以上的运维团队至少一周的工作量,涉及算力、网络设备等软硬件的安装、设备和场地的管理以及安全能力的部署。但传统分发方式也存在着显著的可扩展性差、效率低的问题,难以支持用户算力需求突增的场景。伴随着云计算的发展,算力资源也从最初的物理机部署发展为容器化部署,实现了算力分发从命令式到声明式的转变,即以分发结果为核心,分发过程交付给容器化部署技术自动执行,一方面在保证分发结果的同时排除人为操作引入的异常,极大降低出错概率与人力成本;另一方面将用户的精力从资源运维集中到业务开发,进一步降低了云计算的使用门槛和时间成本。阿里云公开数据显示,其云上容器服务产品基于开源的声明式算力分发方式进行改进,可以实现几十秒内完成1000 个算力节点的部署。

(三)云计算持续发挥创新孵化效用,向上定义数字应用新界面。 云计算抹平了数字世界的技术认知鸿沟,提供了统一的数字应用创新基座,将数字技术对应用的价值提升到全新高度。主要体现为以下三个方面: 应用范式方面,云计算支撑应用从混乱无序到标准化的重塑。传统云计算借助集约化模式为应用供给庞大的算力资源,解决了基础设施的标准化问题。然而单纯的资源上云只是将应用的运行环境从本地搬到云上,应用的构建、部署、交付模式并未发生本质变化,价值增益有限。云原生作为新一代云计算的技术内核,通过容器、微服务、DevOps、服务网格、Serverless 等核心技术方案解决了应用的标准化封装与交付、应用间的标准化交互问题,统一了云上应用的底层语言,充分剥离复杂底层环境对上层应用的影响,将视角真正地聚焦到应用侧。以 ChatGPT 为例,得益于云原生技术对多元异构数据的统一接入,对单一维度应用的统一部署,模型的信息集成、处理效率、计算精度和能力输出实现显著提高,使得其智能化水平走在同类产品的前列。

工程模式方面,云计算助推应用从单点创新到体系化创新的突破。云计算提供了数字时代的标准化沟通语言,软件、硬件等各领域正持续围绕云生态演进,相互割裂的单领域维度的散点创新借助云计算这一超级操作系统实现交融、互促、发展。云计算充分发挥孵化器效用,激发并连接各领域的创新,各领域的创新又以云上服务的形式反哺于云,生于云长于云的数字应用天然就能够享用云及其配套生态,实现更高维度的创新。以大模型为例,传统AI 为应对不同场景需针对性进行开发、训练、调参,碎片化的场景阻碍了AI 的体系化创新,云计算强大的算力与标准化服务能力显著降低了大模型的训练成本,多场景创新迸发叠加效用,体系化提升AI 模型的应用价值。

商业形式方面,云计算放大生态合作价值推动应用可持续演进。新业态新场景持续涌现,各行各业的数字应用需求存在较大差异。单个云服务商的能力不可能覆盖全部诉求,只有转变商业拓展思路,持续完善以云计算为底座的产业生态,才能触达更大的用户群体。一类企业通过合作形式,密切连接生态伙伴,发挥各自优势,通过组合拳服务好目标客户的应用需求。以华为云为例,2020 年其伙伴收入增速达 188%,高于自身 168%的增速。截至2022 年底,华为云已拥有超过 4 万家伙伴企业,生态伙伴收入同比增长超55%。另一类企业则通过技术投资形式,补齐战略规划版图。以微软为例,从2019 年开始其陆续向 OpenAI 投资 130 亿美元,在资金与独家算力的支持下 OpenAI 得以开展模型训练与算法优化,并逐步对外输出产品能力,微软将在 Azure、Office 等产品中融合OpenAI 沉淀的相关能力,快速提升智能化水平。

参考报告

云计算白皮书(2023年).pdf

云计算白皮书(2023年)党的二十大报告提出,要构建新一代信息技术等一批新的增长引擎,打造具有国际竞争力的数字产业集群。云计算是信息技术发展和服务模式创新的集中体现,是信息化发展的重大变革和必然趋势,是信息时代国际竞争的制高点和经济发展新动能的助燃剂。云计算引发了软件开发部署模式的创新,成为承载各类应用的关键基础设施,并为大数据、物联网、人工智能等新兴领域的发展提供基础支撑。加快推动云计算创新发展,顺应新一轮科技革命和产业变革趋势,是推进中国式现代化进程的关键。

查看详情
相关报告
其他答案
匿名用户编辑于2023/07/31 13:57

数字世界通过数字记录、描绘并模拟现实世界,是现实世界的数字映射。数字技术实现了对现实世界的数据采集、存储,并能提供分析处理数据所需的算力。云计算作为链接数字世界计算资源与数字应用的纽带,能够有效整合海量、泛在的算力资源,加速数字应用的感知、判断和执行。

我来回答