AI算力三要素、核心产业及趋势有哪些?

AI算力三要素、核心产业及趋势有哪些?

最佳答案 匿名用户编辑于2024/06/28 09:18

大模型向端侧推理演进。

1.AI算力三要素

AI三要素:算力,超摩尔定律迭代

3月,英伟达推出Blackwell芯片,6月初,英伟达公布整体芯片计划,预计将于2025年推出Blackwell Ultra,2026年推出名为“Rubin ”的下一代AI平台,该平台将采用HBM4内存。 海光深算二号已经发布并实现商用,深算二号实现了在大数据处理、人工智能、商业计算等领域的商业化应用,具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号实现了翻倍的增长。深算三号研发进展顺利。

AI三要素:应用,垂直和通用选择

大模型趋于分化,通用和垂直两条道路。美国模型聚焦通用,国内模型聚焦垂直行业。 通用大模型:参数普遍达上千亿甚至万亿,需要高算力进行模型训练,适用性广,如谷歌“BERT”、OpenAI“GPT” 等。 垂直大模型:参数普遍几十到上百亿,所需算力小于通用模型,但对数据的专有性要求高,行业客户更易接受,能够看到明显受益。如华为“盘古”大模型。

AI三要素:能耗,催生能源供应趋紧

2022年中国数据中心耗电量2700亿千瓦时,其中智能算力总规模已达到197EFLOPS,年耗电量约730亿度电:到2027年,全国数据中心的耗电量将达到1.1万亿千瓦时,占全社会用电量的比重将达到8.6%。2024年至2030年,我国GPU算力集群年度总耗电量将增长约10倍,年复合增长率为49.8%,新增的GPU算力集群功耗远低于我国新能源装机容量的增长。

2.算力核心产业

算力核心产业包括以软硬件的方式对外提供计算与服务能力,硬件主要包括AI芯片、光模块、高速铜缆、服务器、交换机、智算中心、可视化运维、液冷等。

算力芯片:美国限制先进芯片出口中国

2023年10月,美政府出台新的芯片出口管制规定,阻止美国芯片制造商规避政府限制向中国出售半导体,对性能满足以下条件的芯片实施出口管制:  (1)总计算能力TPP达到或超过4800的芯片;(2)TPP达到或超过1600且PD达到或超过5.92的芯片;(3)2400≤TPP<4800,且1.6≤PD<5.92的芯片;(4) 1600≤TPP,且3.2≤PD<5.92的芯片。 受此影响,英伟达无法向我国出口高算力AI芯片。

算力芯片:国内设立安全可靠等级支持国内芯片

据《华尔街日报》报道,中国推动替代外国技术的重点是将美国芯片制造商从中国电信系统中剔除。电信运营商在2027年前逐步淘汰作为其网络核心的外国处理器,此举将打击美国芯片巨头英特尔和AMD。23年12月26日,中国信息安全测评中心公布了安全可靠测评结果公告一级获证企业名单,其中在获批的18款处理器全部来自中国企业,包括鲲鹏、飞腾、龙芯、海光等芯片,英特尔和AMD均不在列。

光模块:高速率、低功耗、低成本趋势明显

算力对互联需求倍增,带动光模块整体需求提升,随着光模块在数据中心互联中的成本占比不断攀升,高速率、低功耗、低成本成为行业主流趋势。800G/1.6T将成为行业主流。数据中心交换芯片吞吐量2023年达到51.2Tb/s,2025年之后达到102.4Tb/s,800Gb/s和1.6Tb/s更高速率将成为实现高带宽数据交换的重要选择。 CPO/LPO/LRO等新形态将是长期迭代方向。 CPO/LPO/LRO差异点主要是封装模式的不同,低功耗方面,相比于可插拔光模块,LPO的功耗下降明显,与CPO的功耗接近。

光模块:海外800G批量应用,未来将配备1.6T光模块

根据Lightcounting 预测,光模块的全球市场规模在2022-2027年或将以CAGR11%保持增长,2027年有望突破200亿美元,增长驱动力主要来自800G、1.6T、3.2T光模块需求,太网光模块销售的预测,将从2023年的12亿美元增至2024年的30亿美元和2025年的50亿美元。根据英伟达GTC大会资料,HGX H100集群需要400G IB网络,GB200 NVL72液冷集群需求800G IB网络,1.6T光模块需求有望放量。Marvell公司市场业务将从23年的34亿美金增长到28年的111亿美金,CAGR 为27%,包括数据中心内部互联光互联,CAGR为25%;数据中心内部有源电缆DSP,CAGR为59%。

铜互连:数据中心低成本短距离连接方案

DAC高速线缆(Direct Attach Cable)也可译为直接电缆或直连铜缆,由一根铜缆和两端的连接器模块组成,广泛应用于短距离存储区域网络、数据中心和高性能计算机连接。DAC包括无源铜缆(PCC)、有源铜缆(AAC)和有源电缆(AEC)。 AOC有源光缆(Active Optical Cable),将2只光模块与光缆封装在一起,实际上就是带光模块的光纤跳线。AOC一般长度比较短,最多也就几百米,最大的特点是光模块和光纤做成了一体,不可分离。

服务器:中国AI算力市场高速发展,将成为第二增长极

算力持续增长,AI服务器应用场景更加广泛。Trendforce预估,预估2024年全球服务器整机出货量约1,365.4万台,年增约2.05%。同时,市场仍聚焦部署AI服务器,AI服务器出货占比约12.1%。我们认为,主要受惠于北美云端数据中心业者订单带动,AI training芯片的出货量将会增长。 中国AI算力市场高速发展,将成为第二增长极。根据IDC预测,到2027年中国加速服务器市场规模将达到164亿美元。其中非GPU服务器市场规模将超过13%。智慧城市、智能机器人、智能家居、工业领域将成为主要应用领域。

交换机:国产厂商快速崛起,800G高端交换机已突破

2022年中国交换机行业市场规模为591亿元,同比增长17.96%,预计2023年市场规模达到685亿元。 国产设备商快速崛起。2022年中国市场数据中心交换机前三厂商为华为、新华三和锐捷网络。从份额占比来看当前国内交换机市场双龙头格局特征显著,华为占比36%、新华三占比32% 我国主要厂商突破技术瓶颈,实现快速发展。新华三旗下S10500、S12500等系列交换机,多采用CLOS架构,提供Seerblade高性能AI计算模块,目前已形成了完整的数据中心产品体系。华为主推CloudEngine系列数据中心交换机,系列基于华为新一代的VRP8操作系统,2023Q1该系列以34.6%的份额排中国数据中心交换机市场第一,其中16800-X为全球首款800GE数据中心核心交换机。

液冷:液冷市场将迎高复合增长,国产厂商布局全面

中国液冷服务器市场在2023年继续保持快速增长。2023全年中国液冷服务器市场规模达到15.5亿美元,与2022年相比增长52.6%,其中95%以上均采用冷板式液冷解决方案。IDC预计,2023-2028年,中国液冷服务器市场年复合增长率将达到45.8%,2028年市场规模将达到102亿美元。 国内专业液冷温控供应商主要有英维克、申菱环境、佳力图、高澜股份、同飞股份等,其中英维克机柜温控收入占比41%,截止2024年3月公司在液冷链条的累计交付已达900MW。合作模式为绑定服务器厂商如超聚变、宁畅、新华三等推出定制化液冷解决方案。

3.算力产业趋势

产业趋势一:大模型向端侧推理演进

边缘终端嵌入大模型。高通在骁龙芯片上成功推理 stable diffusion 模型,华为推出基于手机算力的“智能搜图”功能。 大模型转小模型是必须之路。基于大模型开发的小模型针对性更强,可以迅速地应用到各行各业,给用户提供多种服务,常用的方法有知识蒸馏、剪枝、压缩、量化 模型裁剪。

产业趋势二:算力/带宽/内存提升硬件支撑

目前面向行业的模型已实现边缘嵌入,如图像识别、人脸识别、简单交互,但这些算法都是基于CV算法、CNN算法,模型的参数上限有限,非生成式transform架构; 未来大模型趋势将由作坊式向工业式转变,降低门槛。在医药研发、卫星遥感、灾害评估、自然生态监测等场景、医疗、金融、工业、教育等多个领域发挥作用。 目前实现大模型的运行需要具备三个要素:1、算力;2、带宽;3、内存。其中硬件是急需解决的瓶颈,在AI算力逐渐突破的背景下,所需硬件耗费将越来越多,难以实现对带宽和内存的支撑。

产业趋势三:DCI算力互联

算力互联提供国内顶级的高性能AI算力支持。算力互联启动新一轮自营AI算力资源池大规模集群扩容,包括H800AI算力服务,采用ACMCube™一体化算力基础设施解决方案,核心计算节点HGX单主板八个H800 80G GPU NVSwitch,使用Nvme高速本地数据盘和全新的PCIE5.0 IB网络,由多种最新技术构建了目前最为强大的AI算力节点。 市场空间巨大,产业布局加速。2022年全球数据中心互连(DCI)技术市场规模达到54.02亿美元。中国移动2023年建设了长达5000KM的400G OTN线路测试;华工科技发布400GZR/ZR+/ZR+Pro系列相干光模块。

参考报告

通信行业分析报告:AI景气赛道,国产全链受益.pdf

通信行业分析报告:AI景气赛道,国产全链受益。AI算力三要素;国产算力产业链受益;算力产业趋势和重点标的。

查看详情
相关报告
我来回答