算力设备绿色技术发展情况如何?

算力设备绿色技术发展情况如何?

最佳答案 匿名用户编辑于2023/12/15 14:32

现阶 段,针对算力设备的绿色技术发展,主要围绕服务器计算高效、先 进存储、网络传输无损等方面进行研究。

1.服务器硬件节能方向广泛,动态能耗管理智能化发展

服务器承载处理数据和实现结果输出的功能,是算力供给的核 心装备,也是数据中心中最主要的业务耗能设备,约占数据中心 IT 设备能耗的90%。伴随社会对信息计算力需求呈指数级增长,服务器 生命周期的高效节能对算力绿色发展至关重要。 在过去很长一段时间,为了满足不断增长的用户数据处理需求, 企业主要是通过扩大机架和服务器规模来提供更多算力,但是这也 会导致运营成本的增加和场地空间的浪费。发达地区日益紧张的土 地资源使得以扩大服务器规模来提升算力水平的数据中心建设模式 难以开展。依据指令集架构、处理器个数、产品形态等维度,服务 器被分为了多种类型,产业循着上述方向对服务器的高效节能做出 优化。从指令集架构上看,基于精简指令集(RISC)架构的处理器 以其低功耗、高效能、成本低、高可靠的优势正在成为让信息计算 更绿色的主力。从逻辑上来看,CPU 的指令集可以分为两种主要类型, 即复杂指令集(CISC)和精简指令集(RISC)。复杂指令集的代表 是 X86,由英特尔和 AMD 主导;精简指令集包括 ARM 架构、RISC-V 架构、MIPS 架构等,以 ARM 架构为主流代表。随着产业智能算力需求 的不断增长,以及生成式 AI 对于异构算力的庞大需求,ARM 架构服 务器在云游戏、数字人等新兴应用市场展现出独特优势。据投资银 行 Bernstein 数据显示,我国数据中心正在加快部署 ARM 服务器, 截至 2023 年一季度,我国已拥有占全球约 40%的 ARM 服务器。从产 品形态上看,建设高密度服务器成为提升计算效率的重要举措。高 密度服务器内,电源和风扇以共享方式进行设计,位于同一机箱内 的多台服务器节点可以共享电源和风扇,一方面降低了机体的重量 和空间占用,提升单位面积算力,另一方面能够提升电源和散热系 统的使用效率,降低运营成本,能够进一步增加数据中心功率密度 和数据中心“每平方米”的计算能力。刀片服务器是高密度服务器 的一种,主要应用在商业智能分析及数据挖掘等大规模计算场景, 具有耗电量低、可靠性高等优点。整机柜服务器是提升计算密度的 另一种形式,依据模块化设计思路优化服务器内部架构,采用工厂 预制的设计大幅缩短工期。宁畅 B8000 整机柜服务器,采用全液冷 整机柜设计,设备散热效率提升 50%,功率高达 100KW/柜,PUE 最低 可至 1.09。并在服务器内存池化未来形态上进行深度探索,采用水、 电、网三路盲插设计,比传统部署周期提升 30 倍,可实现高密算力、 轻松部署、绿色节能、快速交付、智能运维。

除了上述从计算需求角度提高服务器能效外,还可以通过管理 工具加强对电源、风扇等其他硬件的控制力度来进行能源节约。服 务器整机节能技术有功耗封顶节能技术、动态调频调压、启动低功耗、智能能耗管理等技术。功耗封顶技术通过服务器内置的功耗测 量模块来实时获取服务器的运行功耗,然后通过限制处理器或者其 他部件的性能来将服务器的总功耗控制在设定的上限功耗以下,防 止功耗超标的同时提高服务器利用率。动态调频调压技术是在服务 器低负载时降低CPU 频率和电压,降低CPU 的漏电损耗和开关损耗, 大幅度降低处理器功耗。某些服务器会将预先调优好的功率模型内 置于 BIOS 中,在不影响性能的情况下为工作负载实现插槽节能。启 动低功耗技术包括硬盘错峰上电、刀片错峰上电、CPU关核技术,确 保服务器上电过程的功耗低于系统下的运行功耗,消除上电瞬间电 流过大带来的供电风险,同时为用户节省电费开支。智能能耗管理 包括在服务器内置遥测工具,这些工具提供关键的数据和 AI 功能, 帮助企业智能地监测和管理 CPU 资源、建立模型来帮助预测数据中 心或网络的峰值负载,调整 CPU 频率以便在需求下降时降低用电量, 还能够在有可再生能源供应时选择性地增加工作负载,从而有机会 降低数据中心的碳排放量。

联想从芯片、整机、系统等不同层次进行技术创新,在芯片级 别做到了服务器的功率监控;适用业界最高运行效率的电源,并通 过智能休眠技术,自适应动态调整工作电源状态;在服务器内部使 用高效散热设计,均匀化散热器热流及流阻,采用航空涡轮设计技 术,通过双马达冗余热插拔风扇,使风扇在较低转速下即可处于最 高效率工作点,在增加散热的同时,节省能源。在系统层次上通过 负载均衡技术、监控数据分析预测技术等实现自适应节能。新华三液冷动态智能控温管理平台,支持服务器级别的智能调温。当机柜 内服务器业务负载变化时,智能控温管理平台可监测服务器温度, 通过调整泵速和电动调节阀开度,动态调整二次侧回路的温度和流 速,实现随着业务的不同维持温度动态平衡。当服务器正常运行时, 动态降低泵转速,降低能耗,在部分服务器温度升高时,动态提高 泵转速,保证业务进行。动态能耗管理智能化,可有效降低能耗15% 左右,做到了 IT 监控和基础设施调控的融合创新。

3.先进存储大幅削减能源消耗,数据软件技术有效提升存 储效率

据 IDC 数据显示,全球数据年产生量将在 2025 年达到 175ZB。 为保存不断增长的海量数据,对存储容量的需求亦成几何式增长, 存储耗电量激增,高性能、低能耗存储需求攀升。 数据分级、冷热数据分治、优化存储设计成为降低单位容量数 据成本和功耗、提升数据存储效率和密度的有效方式。随着数据量 的爆炸式增长以及数据类型的日益细化,让数据分级和冷温热数据 分治可更好的降低存储能耗。热存储是指将数据存储在经常访问的 存储介质上,具有访问速度快的优点,适合频繁访问的数据。固态 硬盘(SSD)读写速度快、功效低且发热量少,更适合热存储,即热 数据的存储场景。固态硬盘存储介质有 FLASH 闪存芯片和 DRAM 存储 芯片,闪存介质存储有高密度、高可靠、低延迟、低能耗等优势。 目前,SSD 单盘容量已经达到30TB以上,在同等应用场景下,SSD数据访问比磁盘快 100 倍左右,吞吐量大 100 倍,数据存储能力大幅 提升。冷存储通常使用离线介质将数据保存在不需要实时访问的位 置,通常用于存储备份、归档或低访问频率数,常见的冷存储介质 包括机械硬盘(HDD)、磁盘、光盘等。机械硬盘读写速度相对较慢、 使用寿命长,适合冷存储场景。此外,磁带、蓝光光盘等载体也常 用于温、冷数据的存储,磁带生命周期内二氧化碳排放显著低于硬 盘并且磁带可以大大减少电子垃圾的数量。光存储用电量仅为磁盘 阵列存储的几十分之一,能够有效降低数据中心 PUE 值,是未来绿 色数据中心建设行之有效的存储介质。合理的存储设计是节能降耗 的关键,数据中心存储采用高密设计和风液冷设计来降低能耗。高 密化设计上,专门设计的高密存储型节点,密度达到传统存储服务 器的 2-2.6 倍,结合存算分离架构,同等容量下带来能耗节约 10%- 30%。风液冷设计上,采用风液冷技术与数据存储结合已经成为趋势。 CPU、GPU 等大功率器件采用液冷,其他器件可采用风冷/液冷,显著 降低了内存、HDD 等存储关键部件的工作温度,可降低风扇转速 50% 左右,维护设备运转性能。

数据融合技术、软件编码技术、数据重删技术和探索系统协同 节能是业界研究的热点。数据融合技术,允许多云多业务共享存储 系统的文件资源,减少数据搬迁和重复存储,提升 35%的数据处理效 率,降低约20%能耗。软件编码技术,在大数据分析场景,采用存算 分离架构后,利用数据纠删码(Erasure Code,EC)技术替代传统 三副本数据冗余,可以把磁盘利用率从 33%提升到 91%,降低能耗40%。数据重删技术,利用定长重删、变长重删、相似重删算法把相 同数据删除,通过数据压缩、压紧算法把定长的数据块优化数据存 储布局,节约存储空间。借助闪存介质带来的 100 倍性能提升,目 前业界已经能够在数据库、桌面云、虚拟机等业务场景实现 2-3.6 倍的数据缩减率(重删压缩前数据总量/重删压缩后数据总量),耗 能节约 50%以上。探索存储系统协同节能方式,可通过感知存储中 不同控制器中 CPU 的业务压力,动态实现 CPU 降频,甚至可以根据 大量业务运行数据对存储不同时期的全局负载进行建模,实现预测 式的精准降频、动态节能。

中国电信天翼云自主研发的存储资源盘活系统 HBlock,可以把 通用服务器及其管理的存储资源转换成高性能的虚拟存储阵列,通 过标准 iSCSI 协议提供分布式块存储服务,可被视为本地盘阵的替 代品,用于本地数据存储,帮助用户提高资源利用率,优化资源成 本。以天翼云云计算业务调动系统为例,存储资源盘活技术通过盘 活天翼云公司内部存量的服务器资源,实现存储资源的再利用,将 原有的存储资源利用率从 17%提升至 65%,盘活的存储空间组成分布 式存储资源池,节约存储空间 17.8P,当年节约碳排放 231.4 吨,在 一年内节约了 187.4 万元支出。在天翼云科技有限公司为长城紫晶 提供的解决方案中,该技术盘活了内部约 100TB 的存储空间。在天 翼云内蒙古和林格尔云存储 OOS 机房,通过部署存储资源盘活技术, 每年为电信内蒙古园区降低了 12 万元的预算,当年减少 81 吨标准 煤消耗,减排 330 吨二氧化碳。

3.网络传输设备向无损化发展,智能弹性网络进一步增强

传输效率 算力的传输和供给需以可靠的网络连接为基础。一方面,庞大 用户规模的加速增长离不开网络传输设备的提速换代;另一方面, 配合云计算、大数据、物联网、人工智能、虚拟现实/增强现实等数 字技术和产业的融合应用发展,打造无损高效的网络运载服务能力, 是在数字经济绿色发展道路上需要迈出的关键一步。

部署超低损耗光纤、实现全光接入网络覆盖是降低损耗、提升 网络传输效率的关键。超低损耗光纤常用于长距离和高速光信号传 输,具有更低的损耗、更强的抗拉强度和更小的弯曲半径,可以支 持更远的传输距离和更高的传输速率。现网中光缆 G.652 光纤占比 较高,超低损大有效面积的 G.654 光纤正在加快落地应用当中,这 种光纤在 1.55μm 处的损耗极小,仅有 0.18dB/km。G.654E 光纤的 应用,降低了衰减和非线性等因素的影响,可以减少光放站和光再 生中继站的设置,有效降低网络运营成本。全光网是指光信息流在 传输及交换时始终以光的形式存在,而不需要经过光/电、电/光转 换。相对于无线传输和电域交换技术,全光网技术在单位比特公里 传输能耗和单位比特交换能耗方面,节能效果十分显著。根据中国 电信实际网络统计,与链状密集波分复用(DWDM)系统相比,ROADM 全光交换网可降低大约 50%的能耗和机房空间、节约大约 30%的成本。

网络动态适配技术和网络弹性智能技术可通过优化网络资源利 用减少能源消耗。网络动态适配技术在不降低网络设备处理能力的 情况下,通过动态调整路由协议可以达到节能的目的。网络设备可 以根据网络负载变化动态调整网络接口速率,也可以通过计算网络 设备负载动态调整处理器的电压与频率,提高处理器能效。网络设 备协议节能技术根据网络协议的特点,动态感知网络流量的实时变 化来动态调整路由,使得在网络连通性和网络性能等约束条件下使 用的网络资源最少。网络弹性智能技术可以根据需求动态调整连接 和带宽,提升网络整体效率,实现整体节能的效果,例如 SRv6、 FlexE 技术。SRv6 是一种基于 IPv6 平面的源路由技术,SRv6 继承了 SR(段路由)给网络带来的所有好处,如简化协议、简化网络(设 计、部署、维护)、高可靠性、源路由技术、SDN 理念等,可以实现 灵活的网络互连。FlexE(Flexible Ethernet,灵活以太)技术是 基于高速 Ethernet 接口,为满足高速传送、带宽配置灵活等需求而 发展的技术,可以提供灵活、高效、可靠的通信通道,支持多种业 务处理和网络切片,提升网络性能和资源利用率,有助于网络的高 效管理和运营。

参考报告

绿色算力技术白皮书.pdf

绿色算力技术白皮书。随着我国产业结构持续优化升级,算力已成为推动各领域数字化、智能化转型的重要基石。算力是数字经济时代集信息计算力、网络运载力、数据存储力于一体的关键生产力,为推动数字中国建设提供了有力支撑。2020年9月我国正式提出“双碳”战略目标以来,绿色低碳、节能环保成为各产业布局的底层逻辑,经济社会对生产、应用和消费绿色算力提出明确诉求。

查看详情
相关报告
我来回答