2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 来源:天风证券
- 发布时间:2026/02/14
- 浏览次数:129
- 举报
TPU v7 的革新之路——极致算力效能与成本经济性!
核心算力:新一代MXU架构与FP8性能跃升 !
性能数值的背后是微架构的胜利。进入LLM时代以来,TPU v6 Trillium的脉动阵列尺寸从128*128扩大到256*256,使得其峰值理论浮 点运算能力提升了惊人的两倍。TPU v7 延续了在v6中引入的256 × 256脉动阵列 ,每个芯片包含了两个TensorCore,每个 TensorCore 都有两个MXU(256*256),即采用等效 512 × 512 的脉动阵列,这使得TPU v7 实现了 FP8下4,614 TFLOPS 的峰值 吞吐,较TPU v5p提升 10 倍。 TPU v7(Ironwood)在浮点运算性能、显存容量和带宽方面接近英伟达旗舰级GPU的表现。与 GB200 相比,Ironwood 的浮点运算 性能和显存带宽仅略有不足,容量方面则与GB200相同,均采用 8 芯 HBM3E 显存,但与配备288GB、12 芯 HBM3E 显存的 GB300 相比差距仍然很大。
卓越性能秘诀:极简设计专注神经网络推理
极简设计带来优秀的性能表现。CPU和GPU等通用处理器必须在各种应用中提供良好的性能,它们发展出无数复杂且以性能为导向的机 制。但其副作用是,这些处理器的行为难以预测,这使得神经网络推理的延迟难以保证在特定范围内。相比之下,TPU的设计极其简洁且 确定性强,因为它一次只需运行一项任务:神经网络预测。TPU 的确定性执行模型比 CPU 和 GPU 的时变优化更符合我们神经网络应 用的 99% 响应时间要求。 借助 TPU,谷歌可以轻松精确地估算运行神经网络并进行预测所需的时间。这使谷歌能够在保持几乎所有预测的严格延迟限制的同时, 以接近芯片峰值吞吐量运行。例如,尽管MLP0 应用的延迟限制为7 毫秒,但 TPU 的吞吐量仍比目前的 CPU 和 GPU 高出15 到 30 倍。 对于 MLP0 应用,谷歌将第 99 百分位预测延迟限制在 7 毫秒左右,以确保基于 TPU 的 Google 服务始终提供快速的用户体验。在延 迟限制下,TPU 与当前 CPU 和 GPU 在六个神经网络应用中的整体性能(每秒预测次数)对比,在最显著的情况(CNN1应用)下, TPU 的性能比 CPU 提升了 71 倍。
成本:卓越的成本优势重塑算力经济性!
TPU v7 Ironwood 的单位有效浮点运算成本远低于NVIDIA GPU。谷歌通过博通代工仅需支付TPU的利润,而购买英伟达GB200则意 味着要为其GPU、CPU、网络及连接件等全链条硬件支付高昂的品牌溢价。凭借这种供应链上的‘解耦’优势,谷歌TPU v7 Ironwood 在全3D Torus配置下的综合成本(TCO)较GB200节省了近44%。结合TPU v7更高的MFU使得单位有效浮点运算成本大大降低,大 约15%的MFU就能达到盈亏平衡点,而GB300 的MFU为30%,意味着即使谷歌的浮点运算利用率只有 GB300 的一半,也能实现收支 平衡。考虑到谷歌内部对自身模型的深刻理解,他们在 TPU 上实现的 MFU 可能高达 40%。这将使每有效训练浮点运算的成本降低约 62%。
软硬协同:Mosaic编译器驱动SparseCore实现全融合
TPU 确立了明确的“分工解耦”架构定位。主核心 TensorCore (MXU) 专注于其擅长的矩阵乘法,负责核心的稠密计算 (Dense Compute);而 SparseCore 利用与HBM和ICI的直连优势,接管了gather/scatter任务,仅以5%的芯片面积和功耗实现了对 embedding操作5-7倍的加速,此外SC还配备了负责调度的 Sequencer (SCS) 和 负责计算的 Tiles (SCT),同时依托并行 (Parallelism)机制,使 SparseCore 与 TensorCore 能够同时运行。 针对传统 vLLM MoE 内核中“按专家 ID 排序”导致的 TPU 性能瓶颈(排序慢、通信无法重叠),谷歌推出了“全融合 MoE”方案。 依托 JAX DevLabs 和 Mosaic 编译器,TPU v7 实现了 MPMD(多程序多数据)编译模式。该模式下,SCS 和 SCT 能够执行完全不 同的内核程序,从而彻底摒弃了令牌排序步骤,并实现了 MoE 调度与通信的完美重叠。最终,该方案使 MoE 推理速度较现有内核提升 了 3-4 倍。
OCS核心优势、交换机原理与全层级网络架构演进
Ironwood:定义下一代超算互连标准
1. 核心观点
TPUv7 Ironwood的机架设计不仅是硬件的堆叠,谷歌在AI性能/TCO上的优势不在于单颗芯片本身,而在于从系统级视角整体设计 TPU, 使芯片在真实部署中以更高效、更灵活的方式协同工作。通过将 64 颗 TPU 高度集成在一个物理机架内,并对应逻辑上的4x4x4 3D Torus立方体,Ironwood在保持极高互连密度的同时,采用更易维护的铜缆与光纤组合。
2. 架构详解
机架规格与密度:TPU机架在最近几代产品中采用了相似的设计。每个机架由16个TPU托盘、16个或8个主机CPU托盘(取决于冷却配 置)、一个机架顶部交换机(ToR Switch)、电源单元以及电池备份单元(BBUs)组成。机架内部布局:机架内部包括TPU托盘、CPU托盘、ToR交换机、电源与BBUs。每个TPU托盘为一块板,集成4颗芯片。托盘间通过 外部铜缆或光模块进行ICI互连,与CPU托盘通过PCIe DAC连接。液冷采用主动阀控流量,VRM位于PCB另一侧并配冷板。
OCS 拓扑重构:从单立方体闭环到双立方体级联
多立方体扩展模式(开环拼接):当拓扑从单个4×4×4立方体扩展为更大结构(如4×4×8、16×16×16)时,OCS重新配置原本用 于“回绕”的光端口,使其不再连接回本立方体对侧,而是连接到相邻立方体对应Index的TPU,实现立方体级联拼接。在 4×4×8 结 构中,两个4×4×4立方体沿Z轴拼接。
OCS四大技术方案深度对比与Google的路径选择
OCS四大技术方案及Google的选择
Google 在其 Jupiter 数据中心网络演进过程中引入了 MEMS,并在 Apollo OCS 系统中采用了基于 3D MEMS 的光交换实现方案。工 程实践中,MEMS 型光交换在 超大规模端口扩展性(Scalability) 与 低插入损耗(Low Insertion Loss) 这两项指标上有核心优势。



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 沙利文咨询:2025全球通信站点储能系统白皮书.pdf
- 各国电信-信息通信技术的经济问题.pdf
- 通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革.pdf
- 通信设备行业ESG白皮书.pdf
- 通信服务行业ESG白皮书.pdf
- 谷歌云:2026智能体驱动的变革白皮书-企业增长新蓝海.pdf
- 2026年AI智能体趋势报告重塑角色工作流程与商业价值的五大转向-谷歌云.pdf
- 超节点与Scale up网络行业:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局.pdf
- AI算力行业周报:谷歌预期2026年资本开支翻倍,SpaceX收购xAI拟打造太空数据中心.pdf
- 谷歌公司研究报告:云营收加速增长,资本开支指引激进.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 国网信通(600131)研究报告:国网系信息通信服务商,云网融合优势突出.pdf
- 2 5G大产业机遇深度解析(115页PPT).pdf
- 3 5G行业发展最新进展研究报告(45页PPT).pdf
- 4 射频前端滤波器产业105页深度研究报告
- 5 光模块行业深度报告:产业拐点+市场共振.pdf
- 6 中国UWB定位技术企业级应用市场调研(2019 版).pdf
- 7 国家电网:被忽略的5G网络建设方、使用方、运营商.pdf
- 8 物联网产业104页深度研究报告:物联网研究框架与投资机会分析
- 9 车联网产业链深度研究:大幕开启,科技新基建先行.pdf
- 10 光模块专题报告:电信与数通共振,光模块迎高景气.pdf
- 1 2025低空经济场景应用与通信需求白皮书.pdf
- 2 通信行业分析:硅光加速渗透拐点已至.pdf
- 3 通信行业专题报告:国防信息化与智能化建设有望提速,关注板块修复机会.pdf
- 4 光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理.pdf
- 5 通信运营商专题:2024年业绩总结与云计算业务重估.pdf
- 6 通信行业专题报告:数据中心互联技术专题五,液冷—智算中心散热核心技术.pdf
- 7 政策与产业共振,卫星通信板块迎“奇点时刻”.pdf
- 8 仕佳光子研究报告:AI驱动光通信技术升级,AWG、MPO打开成长空间.pdf
- 9 通信行业专题研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾.pdf
- 10 通信行业专题报告:光铜共进,AEC等或受益于AI高速短距连接需求.pdf
- 1 政策与产业共振,卫星通信板块迎“奇点时刻”.pdf
- 2 通信行业光通信系列报告一:AI需求与产品高端化,共驱光模块市场增长新周期.pdf
- 3 通信行业深度:无光不AI,硅基光电子引爆新一轮算力革命.pdf
- 4 光通信行业系列报告二:光电共封装重构算力互连架构,CPO开启高密度高能效新时代.pdf
- 5 通信行业深度报告:超节点,光、液冷、供电、芯片的全面升级.pdf
- 6 通信行业深度报告:超节点:光、液冷、供电、芯片的全面升级.pdf
- 7 光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理.pdf
- 8 2026年通信行业年度投资策略:AI基建与应用加速,卫星互联趋势明显.pdf
- 9 移远通信深度报告:从连接模组到智能生态,领军5G_A与AI时代.pdf
- 10 通信行业周报:AI新变化,光纤光缆或涨价、谷歌液冷和光模块需求或提升、国内AI招标或提速.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 1 2026年通信行业AI电源专题:AI能耗高速增长引发电源架构重要变革
- 2 2026年通信·行业专题报告:数据中心互联技术专题,AI变革推动OCS新技术快速发展
- 3 2026年通信行业专题报告:商业航天快速发展,火箭及卫星制造率先受益
- 4 2026年通信设备行业“液冷加速度”系列报告三:液冷0→1后,从头部厂商表现再看行业变化
- 5 2026年通信行业端侧AI崛起:场景化硬件重构人机交互,引爆产业链新机遇
- 6 2026年通信行业:光纤行业迎来景气周期
- 7 2026年通信行业投资策略:谷歌TPU v7与OCS光交换,架构革新与产业链机遇
- 8 2026年通信行业投资策略:商业航天建设期主线确立,AI算力提供景气强化
- 9 2026年光通信行业深度:驱动因素、发展趋势、产业链及相关公司深度梳理
- 10 2026年通信行业:云厂商大幅提升资本开支预期推动AI建设,量子计算产业进入发展新阶段
- 最新文档
- 最新精读
- 1 中国重汽公司深度研究:从周期到周期成长,中国重汽H的盈利中枢与全球视野下的价值重估.pdf
- 2 新城控股公司研究报告:双轮驱动战略笃行,商业竞争力与财务稳健性巩固.pdf
- 3 石油加工行业大炼化周报:炼厂保护性降负,推动能化产品价格价差上行.pdf
- 4 汽车和汽车零部件行业周报:“十五五”规划发布,战略发展智能汽车+具身智能.pdf
- 5 耐用消费产业行业周报:新型烟草多政策利好渗透率提升,拓竹发布首份消费级3D趋势报告.pdf
- 6 正泰电器公司研究报告:如何看正泰电器出口能力和空间?.pdf
- 7 策略周报:聚焦中东局势和原油走势,A股震荡分化.pdf
- 8 基础材料能源行业月报:供给持续优化下26年景气有望上行.pdf
- 9 信用债周策略:同业存款自律管理升级对短债有何影响?.pdf
- 10 机械行业周机汇0314:从特斯拉看北美光伏产业链发展.pdf
- 1 2026年商业航天行业深度:行业现状、市场规模、产业链及相关公司深度梳理
- 2 2026年国产算力行业深度:驱动因素、政策支持、产业进程、突破方向及相关公司深度梳理
- 3 2025年商品半年度报告_原油:供给逐渐过剩,油价下探仍未结束
- 4 2026年汽车行业:空间、格局及竞争优势探究—两轮车、全地形车及低速四轮车赛道对比
- 5 2026年汽车行业:关注整车预期筑底后结构性α行情,特斯拉Optimus明确今夏量产
- 6 2026年日本资本市场展望:如何看待高市时代下的日本?
- 7 2026年公募REITs春季策略展望:存量重构开新局,REITs蓝海向未来
- 8 2026年从风险识别到价值挖掘:中小银行二永债投资策略分析
- 9 2026年ROE稳定与ROE提升下的两类策略构建
- 10 2026年春季黄金投资策略展望:已凌千峰凭栏望,犹有青云万里程
