数据中心各关键技术特征是什么?

数据中心各关键技术特征是什么?

最佳答案 匿名用户编辑于2024/10/14 13:44

我认为未来新型数据中心将具备多样泛在、安全智慧、零碳节能、柔性资源、系统摩尔、对等互 联六大技术特征。

1. 多样泛在

未来数据中心的发展将出现两极分化,一方面 超大型集约化数据中心的建设将持续增长; 预计到 2030 年,单个集群提供的有效通用算 力将达 70EFLOPS,有效的人工智能算力将达 750EFLOPS,配套的存储规模可达 EB 级;另一 方面满足各行业低时延、数据安全需求的轻量级 边缘计算节点将得到广泛部署;预计到 2030 年, 通过轻边缘采集和处理的数据将超过 80%,企业 生产设备通过物联化和数字化后,接入轻边缘的 比例将超过 80%。同时面向新场景,多种创新 型数据中心也将出现,如太空数据中心、海底数 据中心等。多种形态满足不同场景部署需求的数 据中心将为数字经济的发展提供源源不断的新动 能。

1) 大集群 集约化枢纽数据中心部署的服务器规模达到万台 甚至十万台,对服务器的部署运维效率提出了很 高的要求。传统的数据中心按照服务器为单位进 行部署,服务器需要拆包装,上机柜,接电源线, 接网线 / 光模块 / 光纤,资产录入等一系列工序 后才能部署上线。从运维来看,一个运维人员即 使维护一千台服务器,考虑班次等因素数据中心也需要配置近百人的运维团队。传统的部署和运 维方式已经不能满足未来超大数据中心的要求。 从单服务器走向计算集群,以机柜为单位进行包 装、运输、部署,以机柜甚至整个数据中心为单 位进行运维,可以大幅提升部署效率,并降低运 维人力成本。

2) 轻边缘 随着以云为底座的数字化、智能化从互联网行业 广泛渗透到千行万业,从非实时 Web 交易、社交、 搜索及后端 IT 支撑业务,拓展到实时互动媒体、 元宇宙 AR/VR,工业生产系统、机器人,乃至万 物智联场景。超大规模集约化的数据中心承载的 应用和数据已无法保障遍布任意位置的消费者智 能终端、工业 IOT 终端及机器人对低延迟接入与 处理需要,亟待将云的弹性资源、应用服务及智 能推理能力从超大规模中心延伸到距离各类接入 终端更近的轻边缘系统。 轻边缘的形态包括“轻量级边缘集群”与“轻量 级边缘服务与应用”两类。前者由云服务商提供 小规模的硬件算力集群,并分布式部署在合适的 网络位置,将全栈云服务的部分核心能力如弹性 虚机 / 容器、存储、网络,中间件、数据库、媒 体处理、流数据处理及 AI 推理等时延敏感类服 务及应用软件通过物理或逻辑专线从中心云服务 区扩展到边缘集群站点;后者则以更为轻量化的 容器、函数形式,将中心服务区的中间件、数据 库、媒体处理、流数据处理及 AI 推理等时延敏 感类服务及应用软件部署在由云服务商、运营商、 企业客户、家庭客户、个人消费者及任意第三方 提供的硬件及 OS 环境上,并可通过开放互联网及 HTTP/HTTPs 协议穿越防火墙建立与中心云服 务区的连接。后者不与边缘算力硬件及中心到边 缘的物理专线绑定,因此更为轻量和灵活,而前 者从全栈云中心服务区下沉,其云服务与应用能 力则相对更丰富一些。

3) 新型态 随着大数据、人工智能、元宇宙为代表的数字经 济高速发展,数据中心一方面要匹配用户对低时 延、极致体验的业务诉求,又要应对土地紧缺和 能源供应的挑战。除了主流数据中心走向大集群、 轻边缘的两级化发展方向之外,业界也正在探索 一些新型态的数据中心,以满足特定场景的需求, 如运营商接入网络边缘数据中心、海底数据中心、 太空数据中心等。

2. 安全智慧

1) 高安全 数字经济的核心技术涉及数据、算法与算力三个 要素,确保上述三个要素的安全与合规是数字经 济发展的基础。数据中心作为数字经济的基础设 施,不仅是承载上述三个要素的平台,同时也是 数据流通交易的平台,因此,数据中心必须在系 统设计之初就内置安全能力,并贯穿计算、存储、 网络等数据处理的全过程,覆盖从芯片到应用全 栈,以抵御全方位的安全威胁,预计到 2030 年, 数据中心在安全方面的投资占比将达到 20%。 数据中心的数据基础设施需要在设计上充分考虑 对不同类别和级别的数据提供保护,数据在使用,存储,传输过程中,能够根据不同的数据价值和 合规要求配套不同的安全策略,保证数据在数据 中心内的全生命周期的安全合规,可管可控。同 时,系统应具备根据新的分级和安全防护规则, 自动调整适配的能力。

数据中心需要提供基于零信任理念的安全方案, 使用包括RBAC,ABAC等细粒度的访问控制模型, 对数据的使用进行严格限制。 数据在传输和落盘过程中需要提供加密能力,整 个密码学体系需要充分考虑到抗量子计算攻击的 风险。对于高价值数据提供基于机密计算,联邦 学习,同态加密等使用态的保护方案,实现可用不可见。 高价值数据的防护要具备更强的抗攻击能力,高 价值数据与普通数据隔离存储,高价值数据的完 整性,机密性保护方案,比如 WORM,秘钥管 理和分发的机制,需要考虑提供软硬结合的安全 设计,应对恶意攻击。 面向 2030 年,除了传统的设备安全、网络安全 之外,可信计算、机密计算和 AI 大模型时代的 新安全生态等成为主要研究方向。

2) 高可靠 高可靠的数据中心是支撑数字经济发展的重要基 石。面向 2030,数据中心将从设备级、节点级、 同城级的高可靠,走向更大范围的跨域高可靠; 从主要关注数据级高可靠,走向关注业务连续性 的业务级高可靠,系统级和业务级可用性均将达 到 5 个 9 的水平。 为实现数据中心跨域、业务级高可靠,需要研究 多 DC 数据一致性保障、多 DC 异地多活、基于 AI 的高可靠等关键技术。

3) 高智能 数据中心投资飞速增长,规模日益增大、密度不 断提升,数据中心的复杂程度越来越高,数据中 心的大型化增加了数据中心的建设运营的复杂度 与约束,传统建设运营模式面临挑战。AI 和数据 使能数据中心规划、建设、运营全生命周期,促 进数据中心朝着高效、节能、智能的方向发展。

3. 零碳节能

1) 绿供电 数据中心整体的碳排放量较大,对于数据中心服 务商,高能耗也意味着更多经营成本。随着“碳 中和”逐渐成为全球的共识,数据中心将加速向 绿色低碳的方向迈进:绿电的发展为数据中心提 供了更加丰富、优惠的电能供给,全面助力数 据中心零碳目标的实现。随着全球绿色低碳发 展政策的不断强化,风能、太阳能等清洁能源 在数据中心能源结构中所占比例将会提升,预 计到 2030 年,大型数据中心绿电使用率将达到 100%。

2) 新储能 储能技术通过“削峰填谷”,成为降低数据中心 电力成本的重要方式。数据中心能耗高,电力成 本占运营总成本的 60%-70%,供电公司通常会 提供波峰或者波谷电价,数据中心可利用储能系 统在波谷时存储电力,并在高峰期利用,以降低 数据中心用电成本。国际能源署发布的《2022 年世界能源展望》报告显示,随着越来越多国家 开始加速能源转型,许多国家和地区制定了可再 生能源发展目标及规划,加速能源转型。根据法 国政府计划,到 2030 年,法国可再生能源发电 占比将提升至 40%;到 2050 年,法国太阳能发 电装机容量将增加 10 倍,并建成 50 个海上风电 场。日本最新版能源基本计划提出,2030 年可 再生能源发电占比将提高到 36% 至 38%。全球 可再生能源产业进入一个快速发展期,可再生能 源的渗透率越高,平衡电力系统负荷需求越大, 所需储能时常越长。

3) 液制冷 制冷系统是数据中心除 IT 设备之外的第二大耗 能部分:数据中心的 IT 设备在运行时持续产生 热量,在超出额定功率和范围时会导致服务器宕 机引起业务中断、设备寿命缩短等一系列问题, 所以需要通过制冷系统用来维持 IT 设备的正常 运行。为了降低数据中心的 PUE,先进制冷技术 的研究尤为重要,逐渐成为数据中心的关键技术, 其发展以绿色节能为导向,朝着融合技术创新、 模块化和集成化方向发展,并通过智能化的手段 与 IT 设备的运行状况相结合,进行动态的适配 和调整。 液冷技术多适用于高功率、高密度数据中心,数 据中心的液冷技术目前处于探索阶段,总体发展 趋势良好。随着数据中心机柜平均功率密度的逐 年上升,对液冷技术的需求也就不断增加,液冷 数据中心的市场规模持续扩大。液冷技术的应用 不仅有助于数据中心的节能和降噪,也有助于提 升单位空间的服务器密度

4. 柔性资源

随着公有云、行业云、私有云作为数字化、智能 化平台底座在全球各行业的广泛深度普及,加之 AI 大模型、元宇宙、数字孪生等大颗粒应用的方 兴未艾与爆炸式增长,云化架构将成为未来数据 中心基础设施的“标配”之一,即通过在全球分 布式数据中心硬件之上叠加云操作系统软件,为 千行万业、政企客户以及多样化业务应用提供多 租安全隔离、性能 SLA 保障前提下的大规模集约 化算力、存力、运力共享,以及动态随需而变的 算力、存力、运力供给。 下一代云数据中心架构,将沿着“全池化”、“柔 计算”、“泛协作”的方向持续演进,从而实现 数据中心硬件资产投入产出比的极致最优化。

1) 全池化 通过超大规模资源池化,实现多租、多应用对数 据中心算力、存力、运力资源的最大化共享,是 云最本质的特征之一,然而,由于当前云数据中 心架构与技术的制约,计算、存储、网络资源虽 已具备池化能力,仍存在大量资源碎片化孤岛, 限制了规模化、集约化共享效率的进一步提升。 因此,未来 5-10 年云数据中心的“全池化”是 主要趋势,具体体现在:跨硬件代次 CPU 统一池化、跨节点内存统一池化、存储统一池化(存 算分离)、异构算力统一池化,及 DCN 网络统 一池化。

2) 柔计算 “弹性计算”是当前云数据中心主流的算力分配 与供给模式,即先由云服务商预定义固定规格的 虚拟机或容器,再由云租户从中选取适合自己的 资源规格,以及应用业务是否性能敏感选择 CPU 资源超分比,并基于该固定资源规格以及超分比 进行资源消费的计量计费。该模式有利于最大限 度减少算力分配的碎片化,但却由于为云租户分 配的固定规格资源往往显著大于应用业务的实际 资源需求,导致计算池的平均利用率仅 20%、远 低于 80% 的平均分配率水平,全球云数据中心 内数千万台服务器近一半以上物理算力实际上仍 处于空转状态,其能耗及碳排放并未产生实际价 值。针对上述问题和挑战,未来云数据中心将引 入相比“弹性计算”模式更为灵活、更智能、具 备动态适配应用算力资源需求变化的下一代算力 分配与供给模式“柔性计算”。预计 2030 年, 领先的云数据中心资源分配粒度将达到“函数 级”。在大幅提升云服务商的算力资源池有效利 用率、减少算力资源空置率的同时,也能让最终 云租户与开发者像用水和用电计费那样,为自己 的动态算力消耗而非固定资源规格支付费用,降 低不必要的算力支出与浪费。 “柔性计算”一方面强调极致的弹性,即算力不 仅具备平滑的水平伸缩能力,也支持无缝垂直伸 缩能力,同时也与业界“柔性制造”理念所强调 的高度适应市场需求变化的生产模式相对应,强 调基于普适化的应用精细化资源需求测量,以及 应用 QoS 感知,具备更强定制化及快速需求应 变能力的算力分配与供给模式。实现“柔性计算” 需要支持“应用驱动”精细化画像及初始资源分 配、基于 AI 大模型的应用性能 QoS 劣化感知、 柔性实例二次调度和柔性内存动态复用四个关键 技术。

3) 泛协作 云数据中心计算、存储、网络资源的统一”全池 化“,仅局限于单个地理服务区(Region)范 围内,池化典型容量百万台服务器规模,由 50- 100 公里范围内采用 10Tb 级光纤互联的多个可 用区(Availability Zone)物理资源池构成。考 虑到不同地理服务区在机房单位面积建设 / 租赁 成本、单位耗电成本、PUE水平、电网碳排放因子、 一次性规划可扩容算力空间存在差异,因此可能 导致不同地理服务区单位算力成本存在差异。以 中国西部乌兰察布 / 贵阳及东部北上广一线城市 服务区对比为例,二者相差超过 10%。如何突破 地理服务区的物理边界制约,实现跨区域的 “横 向泛协作”,成为下一代云数据中心架构势在必 行的重要发展趋势。 与此同时,随着移动终端及物联网的技术发展和 普及应用,以及企业业务的跨区域部署,从互联 网到政企客户均产生了从中心云服务区向距离云 租户接入点更近的分布式边缘计算延伸的强烈诉 求,进一步催生了云数据中心基础设施部署将从 集中式向分布式演进,出现了跨大规模中心服务 区与分布式边缘站点之间的“纵向泛协作”新发 展趋势。

参考报告

华为-2024版数据中心2030.pdf

华为-2024版数据中心2030。在AI大模型训练过程中,当模型大到一定规模之后,性能会发生突变,开始呈现指数级快速增长,科学界称这个现象为“涌现”。正是这个性能的突变,让人工智能的发展阶段从感知理解世界到生成创造世界,这也造就了ChatGPT的火热,催生了面向行业的数百个AI大模型的出现。今天,“百模千态”正走向每一个行业、每一个场景、解决客户每一个问题,加速千行万业的智能化转型。人工智能的“涌现”时刻即将出现,人类社会也将迎来一个波澜壮阔的智能时代。迈入智能时代,最大的需求是算力,最关键的基础设施是数据中心。根据华为《...

查看详情
相关报告
我来回答