软硬一体构筑基本盘,绑定大客户共谋 AI 新征程。
1.“白盒+EOS”构筑 Arista 数据中心交换机核心护城河
Arista 另辟蹊径发力白盒,白盒交换机使软硬件解耦,具备低成本、高开放性和高可拓展 性,深受云客户青睐。Arista 的管理层虽大多出自品牌交换机龙头思科,但却另辟蹊径选择 白盒交换机路线,通过开放网络方案实现差异化竞争。白盒化是指将网络中的物理硬件和 网络操作系统(NOS)进行解耦,让标准化的硬件配置与不同的软件协议进行组合匹配, 客户可以组建更加开放和灵活的网络方案,并大幅降低建网成本,同时白盒交换机通常与 SDN 一期使用,具有灵活、高效、可编程等特点。 品牌交换机也可以称为与白盒相对的黑盒设备,从软件到硬件都是完全封闭开发的,导致 不同厂商设备间互通性低,运维团队难以统一管控,且难以快速定位故障。同时,黑盒设 备的封闭式架构对后期网络的升级和功能扩展带来不小的阻碍。裸机交换机主要由台资企 业生产,虽然具有最低的部署成本,但出厂时并不配备网络操作系统,且后续的软件服务、 维护都需要客户自行解决,其更适合网络开发经验非常丰富的巨头厂商。综上所述,白盒 交换机凭借其低成本、高开放性和高可拓展性的优势,已经成为多数云厂商的数据中心组 网首选,而 Arista 正是这一趋势的长期受益者。
我们认为,仅仅凭借“白盒”设计并不足以使 Arista 数据中心交换机在市场上“一枝独秀”, Arista 真正区别于其他白盒交换机厂商的独特优势在于其自研的 EOS 网络操作系统, Arista 正是通过“白盒硬件+EOS 软件”组合打造核心护城河。
我们观察到,Arista EOS 的优势在于: 1)统一性:“单一映像”简化网络管理及运维, Arista EOS 能够实现所有交换机平台的“单 一映像管理”,通俗来讲,即无论是在小型的接入层交换机,还是在大型的核心数据中心设 备上,Arista 的所有硬件都能运行相同的 EOS 系统,这一特性简化了管理和维护流程,使 客户能够通过一致的工具、配置和界面管理整个网络,因而大幅降低了网络运营的复杂性 和成本; 2)开放性与可编程性:提供多种 API 接口使用户可以自由开发与编程,EOS 基于标准的 开源 Linux 内核,云厂商用户可以通过常见的编程语言(Python、C++等)直接调用 API 对网络设备进行编程,或者集成自动化工具(如自家的 CloudVision 平台,结合使用能够提 供全面的网络可视化、自动化和分析功能,并支持大规模设备的批量配置),在大型云计算 环境中,这样灵活的编程接口非常适合云厂商高度自动化和定制化的需求; 3)稳定性和高可拓展性:模块化设计实现各功能模块故障隔离,并易于进行拓展,EOS 采用模块化的多进程架构,允许各个功能模块独立运行,并通过 SysDB 组件共享系统状态 信息,确保各个进程高效协同。即使某个进程出现问题,也不会导致整个系统崩溃,并且 在某个进程模块失效后,EOS 可以通过进程重启在秒级内进行恢复,无需整个设备的重启, 因而提供了更高的稳定性,此外独立模块化设计也使得网络拓展更加容易,客户可以根据 需求添加设备或定制新的功能; 4)高可维护性:EOS 支持不中断软件升级:EOS 支持不中断软件升级(ISSU),即在不 中断网络服务的情况下进行系统升级,这确保了在大规模网络中,当需要进行拓展及系统 更新时,不会影响整个系统服务的连续性。
我们观察到,2014-2023 年十年间 Arista 在高速数据中心交换机上的份额不断增加,2023 年其与思科份额差距缩小至 4%,我们认为这得益于 Arista“白盒+EOS”组合的竞争力, 市场对此或有两大疑问:1)Arista 的 EOS 相对思科的网络操作系统有何独到之处?2)既 然如此,思科为什么不做同样的改变?我们对此作出如下回答:
市场关注问题#1:Arista 的 EOS 相对思科的网络操作系统有何不同? 1)设备兼容性、客户群体角度-Arista “one for all”:思科的网络操作系统分为 IOS 和 NX-OS,IOS 历史悠久,更多面向园区企业级客户,也主要针对思科 Catalyst 及以下系列 打造,NX-OS 系统是思科后来面向云客户开放、可编程的需求打造的,适用于 Nexus 系列 数据中心交换机;对比来看,Arista 仅 EOS 一种网络操作系统,旗下所有交换机、路由系 列通用; 2)开放性/进程设计/可拓展性-Arista 更胜一筹:思科 IOS 系统由于是传统的单进程封闭架 构,支持可编程接口有限,主要适用于中小型网络;思科 NX-OS 系统在开放性、模块化上 作出尝试,可以支持一定数量的可编程接口,也能够实现一定的进程/故障隔离,但仍然需 要与自家设备结合使用;对比来看,Arista 采用完全模块化、独立进程的开放架构,其基于 Linux 内核的特性让它的可编程性更上一层楼,且能够实现完全的进程/故障隔离,并支持快 速、大批量的网络拓展; 3)稳定性/易用性/生态壁垒-思科更胜一筹:这一层面上,思科“One Silicon”理念将硬件 和软件高度整合,其 IOS 系统凭借多年的开发迭代和广泛的客户反馈支持,并结合成熟且 高度优化的代码库,能够确保系统整体的高可靠性和稳定性,NX-OS 也继承了 IOS 的稳定 性,因此客户拿到思科的设备和系统时便已经拥有了完整的、标准化的配置,无需进行太 多复杂的调试和定制;对比来看,Arista EOS 虽然在可编程支持上表现出色,但其应用门 槛较高,要求客户具备类似云厂商这样足够强大的网络配置、技术开发能力。此外,思科 通过绑定硬件设备与操作系统,可以构建强大的生态壁垒,而 Arista 在一开始便选择了开 放开源的生态,因而在“生态绑定”上没有优势。
市场关注问题#2:既然如此,思科为什么不做改变? 我们认为:1)思科并非未做改变,但改变幅度有限,步伐较为谨慎,例如,从此前单一的 IOS 向 NX-OS 过渡转型便是思科所做的尝试,NX-OS 也具备如 EOS 一般的模块化设计、 开放性、多进程性,但转型并不彻底,NX-OS 并未完全实现模块化(比如无法实现像 EOS 那样的单一进程故障自重启),也并未像 EOS 一样一开始就基于 Linux 内核,因而仍需与 自家软硬件产品配合使用来发挥最佳效果; 2)思科并未全面转型的原因在于:I.转换成本较大,思科作为以太网交换机行业的“守擂 者”,其网络设备和操作系统已广泛部署于全球各类企业和组织中,长期客户深度依赖于思 科的体系,如果思科对网络操作系统进行大规模的架构调整,则企业需要花费大量时间和 资源进行系统测试、验证、升级等工作,以完成对新系统的兼容,这一过程将产生大量的 转换成本;II.可能失去生态优势,思科建立了一个封闭的生态系统,客户在使用思科的设备 时,可以享受高度优化的软硬一体式体验,同时思科在向客户提供 IOS 和 NX-OS 网络操作 系统时,或附带很多自有的自动化工具、网络管理平台等增值服务,若更换架构,思科或 失去生态系统带来的一体化优势以及附加业务价值;III.战略定位不同,与 Arista 专注于大 型数据中心和云网络客户不同,思科客户群体不限于数据中心和云计算领域,而是覆盖广 泛的企业客群,目前思科在全球以太网交换机市场仍然占有 40%以上份额(园区级交换机 贡献较大),思科在企业、教育、政府、金融等传统行业仍然占据主导地位,对思科来说传 统企业客户是其最大的基本盘,因此不太可能“舍本逐末”(为了追求数据中心市场的增长 而放弃传统领域的稳固地位)。
2.“使用一流商用芯片”战略助力 Arista 加速产品上市、聚焦软件创新
根据 Arista《优势白皮书》(2021),Arista 将“使用一流商用芯片”看作是近年来公司在云 网络领域取得卓越成就的关键战略。我们认为,这一战略选择带来的优势如下: 1)加速产品上市,商用芯片经过市场的广泛验证,具备稳定的性能和可靠性,Arista 可以 通过调用这些现成的解决方案,更快将自己的新产品推向市场,从而避免自研芯片带来的 漫长开发周期和复杂的测试过程; 2)在性能精进的同时保持灵活性和兼容性,近年来商用芯片的带宽一般每两年翻一番,同 时降低每比特的成本和能耗,Arista 能够持续保持硬件性能的领先地位,同时商用芯片具备 高度的标准化,能够与不同的硬件、软件系统进行集成,因此 Arista 可以灵活地与不同的 供应商平台进行合作,并同时兼容数家产品,适应不断变化技术趋势; 3)降低硬件开发成本,专注软件创新,不同于思科、华为等自研交换芯片厂商,它们在芯 片的设计、开发、测试、生产中投入可观的资金、时间、技术和人力资源,Arista 选择直接 外采商用芯片的形式,大幅降低了硬件开发的成本,相对的,Arista 可以将研发资源更多集 中于核心软件技术的升级迭代上,比如 EOS、CloudVision 等,通过软件方面的优化亦能 带来网络性能的提升。

3.深挖微软、Meta 大客户价值,有望拿到 Meta 十万卡集群网络独供资格
Arista 与微软、Meta 两大云厂商深度合作,2023 年两大客户合计占收比近 40%。根据公 司年报,近年来公司最大终端客户为微软和 Meta,两者 2023 年合计收入贡献为 22.85 亿 美元,合计贡献比为 39%,其中微软在 2019-2023 年对公司的收入贡献占比分别为 23%/21.5%/15%/16%/18%,5 年来份额有所波动,均值维持 18.7%;Meta 在 2019-2023 年对公司收入贡献占比分别为 17%/<10%/<10%/26%/21%,整体呈现先下降后上升趋势。 我们同时关注到,2019-2023 年微软对 Arista 的收入贡献占其自身资本开支比重平均为 2.9%,同期 Meta 对 Arista 的收入贡献占其自身资本开支比重约 2.8%。我们认为,随着 AIGC 应用快速发展,各大云厂商或进一步加码 AI 基础设施建设,资本开支指引有望持续 上修,Arista 作为两大云厂商的紧密合作商,有望深度参与客户 AI 集群组网建设,未来来 自两大客户的收入有望进一步增加。
Arista 有望拿到 Meta 新十万卡集群的网络独供资格,对应收入或为 2.7 亿美元。根据 The Information 报道,Meta 正在对一个超 10 万卡(英伟达 H100)的集群做最后的调整,该 集群用于训练 Meta 的 Llama 4 大型语言模型,预计将于 10 月或 11 月之前完成,该集群 仅芯片成本就可能超过 20 亿美元(若以 H100 ASP 20000 美金/张计算,10 万张 H100 的 成本为 20 亿美元),而 Arista 有望成为该集群的网络设备供应商。我们假设芯片成本占本 集群总资本开支的 75%,网络设备(主要为交换机)占集群总资本开支的 10%,则网络端 对应价值量(也即 Arista 预期获得的收入)为 2.7 亿美元。根据 Arista 3Q24 业绩会纪要, 公司已开始通过 Etherlink AI 交换机平台(尤其是 7700R4)为 Meta 构建大规模集群提供 支持。 市场或有疑问:亚马逊和谷歌是否也是 Arista 的潜在大客户?我们认为,Arista 与亚马逊、 谷歌建立深度合作关系的可能性较小。亚马逊和谷歌或仅在一些特定场景(如小规模计算 场景或者产品方案需要快速推向市场的项目)需要小批量采购 Arista 产品,但长期来看, 由于业务战略重心和技术自主性需求不同,亚马逊和谷歌不太可能像微软、Meta 一样与 Arista 长期深度合作: 1)微软的核心目标是快速拓展其 Azure 云服务及 AI 方面的 Copilot,Meta 的重心是通过 网络集群维持较大的数据中心流量,支撑其社交媒体业务及 Reality Labs 业务,两者均希 望通过购买成熟且具有性价比的网络设备来满足其云计算、元宇宙层面的快速推广; 2)相比之下,尽管亚马逊和谷歌也致力于在云计算和 AI 领域迅速推进,但两者从云计算 时代开始便十分重视软硬一体化发展和成本控制,它们坚持通过自研硬件来获取长期竞争 力(比如谷歌积极自研 TPU 取代商用的 GPU、亚马逊也推出 Graviton 系列 CPU),并减 少对供应商的依赖,因而它们更多采取自研设计交换机+第三方 ODM 代工的模式。
4.推出 Etherlink 平台发力 AI 网络,参与 UEC 联盟保持与先进协议同频
Arista 立足数据中心云网络领域建立的优势,于 6 月推出全新的 Etherlink AI 平台,性能 全面升级,具备高可拓展性,最高支持十万级 XPU 之间的互联。Etherlink 提供一系列固定 配置、模块化和分布式平台组合,这些平台可以单独部署用于较小的集群,也可以组合起 来构建适用于 10 万个以上 XPU 的多层大型拓扑结构。平台组合包括:7060X6 系列固定配 置交换机、7800R4-AI 系列模块化交换机、7700R4 系列分布式交换机以及针对 AI 进行优 化后的 EOS 系统等。
经过 AI 优化的 Etherlink 平台能够带来比传统的以太网、InfiniBand 更优异的性能。根据 Arista《AI-Network 白皮书》,Etherlink 通过将无损、低延迟平台与创新的 RDMA 感知负 载均衡和拥塞规避功能相结合,实现比未优化的传统以太网高出 65%的性能提升(以 AI 作业完成时间计算)。AI 集群除了关注正常运行情况下的峰值性能,也看重故障后的恢复效 率,Arista 测试来看 Etherlink 的故障恢复收敛速度相比 InifinBand 快 30 倍,此外在相同的 Message Size 条件下,Etherlink 比 InfiniBand 的 AI 工作负载性能高出 10%,且未来若升 级到最新的 UEC,该优势还有望继续扩大。我们认为,Arista Etherlink 针对 AI 应用场景进 行了深度的优化,尤其是在任务执行效率以及故障恢复速度方面,展望未来,我们看好以 Arista 为代表的以太网厂商,凭借追平甚至超越 IB 的优越性能,持续在 AI 集群中扩大市场 份额。
Arista 积极参与 UEC 联盟保证与先进协议标准同步。UEC(Ultra Ethernet Consortium) 超以太网联盟是在 2023 年 7 月由微软、Meta、博通、思科、Arista 等 12 名成员创立的, 旨在超越现有的以太网功能,例如 RDMA 以及 RoCE,提供针对 AI/HPC 进行优化的高性 能、分布式和无损的传输层,对标英伟达的传输协议 InfiniBand。截至 2024 年 3 月,UEC 已经发布 1.0 版本协议。Arista 所有 Etherlink 交换机都支持超以太网联盟(UEC)标准, 而 UEC 标准的网卡将在不久的将来上市,Arista 称“Etherlink 交换机+UEC 网卡”结合使 用有望获取额外的性能优势。