2023年通信行业半年度策略:紧抓AI之光.pdf

  • 上传者:罗***
  • 时间:2023/07/24
  • 热度:436
  • 0人点赞
  • 举报

2023年通信行业半年度策略:紧抓AI之光。2023上半年回顾:自2023年2月以来,随着chatGPT的火爆,景气度从光模块传导到服务器、交换机等设备,市场对数据中心的算力网络的增长预期大幅提 升。今年上半年,通信板块大幅跑赢科创50、沪深300等指数。 展望下半年,我们认为AI依然是今年主线,长期来看,建议关注中国光模块产业链崛起机遇。

大模型是一种新的生产力工具,来帮助我们更准确地认知世界和预测世界。大模型的出现是一系列的变革,我们看到不仅是800G光模块、HBM需求旺盛 的现象,其背后是深度学习对于链上所有参与环节的突破,包括解决存储墙出现的HBM、解决算力墙出现的集群和分布式训练、解决通信墙而出现的网 络架构革新、解决功率墙出现的液冷等等,是通信和电子一系列技术新一轮的变革。

本轮光模块800G周期有何不同?网络架构变革是800G超预期的原因。光模块行业是一个周期成长的行业,本身遵循光摩尔定律,即每2-3年网络带宽翻 倍,因此光模块公司的业绩往往跟随速率升级的周期节奏。而本轮800G周期和以往100G、400G的不同之处在于,不仅仅是速率升级,还有网络架构的变 革。我们看到AI数据中心网络架构有两个变革:一个是从Spine-Leaf架构→Fat-tree架构;二是GPU All-to-all直连,这两种变革都额外地、大幅地增 加了光模块需求。我们测算,由于使用Fat-tree的架构,DGX A100中GPU:光模块的比重将达到1:6,而GPU All-to-all直连是光模块增量最大的部分, 使得GPU:光模块从1:2.5大幅提升至1:7。

网络架构的变革的驱动力?传统适用于HPC的网络,无法满足大模型集群训练的带宽和时延需求。大模型训练的本质是将权重参数网络多次迭代,海量 的数据因此需要不停地从存储和计算单元反复转移,需要至少数百万次的迭代,直到输出可接受的结果。而分布式训练需要GPU之间通信,使得AI/ML数 据中心东西流量大增,流量模式也异于传统云计算。分布式训练的两种方式——数据并行(Data parallelism)和模型并行(Model parallelism), 都涉及频繁的GPU间通信。无阻塞(Non-blocking)的网络,由于其不收敛的特点,可以提高网络效率,加快训练速度,这是专用于AI/ML训练的数据中 心,其网络架构从Spine-leaf转到Fat-tree的原因。GPU本身为了解决存储墙而对HBM的采用,虽然使得存储带宽的大幅提升,但也进一步拉大了存储带 宽和网络带宽的差距,使得网络带宽成为算力瓶颈,这是推动GPU进行all-to-all直连的原因。

1页 / 共33
2023年通信行业半年度策略:紧抓AI之光.pdf第1页 2023年通信行业半年度策略:紧抓AI之光.pdf第2页 2023年通信行业半年度策略:紧抓AI之光.pdf第3页 2023年通信行业半年度策略:紧抓AI之光.pdf第4页 2023年通信行业半年度策略:紧抓AI之光.pdf第5页 2023年通信行业半年度策略:紧抓AI之光.pdf第6页 2023年通信行业半年度策略:紧抓AI之光.pdf第7页 2023年通信行业半年度策略:紧抓AI之光.pdf第8页 2023年通信行业半年度策略:紧抓AI之光.pdf第9页 2023年通信行业半年度策略:紧抓AI之光.pdf第10页 2023年通信行业半年度策略:紧抓AI之光.pdf第11页 2023年通信行业半年度策略:紧抓AI之光.pdf第12页 2023年通信行业半年度策略:紧抓AI之光.pdf第13页 2023年通信行业半年度策略:紧抓AI之光.pdf第14页 2023年通信行业半年度策略:紧抓AI之光.pdf第15页
  • 格式:pdf
  • 大小:5.7M
  • 页数:33
  • 价格: 6积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至