2025年澜起科技公司研究报告:内存互连芯片需求+价值双增,Retimer芯片全球前二供应商,CXL布局未来可期

  • 来源:国海证券
  • 发布时间:2025/11/20
  • 浏览次数:771
  • 举报
相关深度报告REPORTS

澜起科技公司研究报告:内存互连芯片需求+价值双增,Retimer芯片全球前二供应商,CXL布局未来可期.pdf

澜起科技公司研究报告:内存互连芯片需求+价值双增,Retimer芯片全球前二供应商,CXL布局未来可期。AI时代内存互连芯片龙头,高性能运力芯片持续增长。公司深耕行业二十载,经历内存产品从DDR2至DDR5时代迭代,在DDR5子代迭代中持续保持领先地位。AI算力需求增长,公司全面布局高性能“运力”芯片,其中PCIeRetimer、MRCD/MDB及CKD芯片均已实现规模出货。公司2025前三季度延续高位增长趋势,实现营业收入6.33亿元,同比增长57.83%,归属母公司股东的净利润16.32亿元,同比增长66.89%,主要受益于AI产业趋势,行业需求旺盛,前三季度公司互...

一、概览:AI时代内存互连芯片龙头,高性能运力芯片持续增长

公司拥有互连类芯片和津逮服务器平台两大产品线

澜起科技成立于2004年,是国际领先的数据处理及互连芯片设计公司,致力于为云计算和数据中心领域提供高性能、低功耗的芯片解决方案。作为科创板首批上市企业,澜起科技于2019年7月登陆上海证券交易所。公司总部设在上海,并在昆山、北京、西安、澳门及美国、韩国等地设有分支机构。

公司目前有两大产品线:互连类芯片产品线及津逮服务器平台产品线。公司的互连类芯片主要包括内存接口芯片(包括RCD及DB)、内存模组配套芯片(包括SPD、PMIC及TS)、高性能运力芯片解决方案(包括MRCD及MDB芯片、CKD芯片、PCIe Retimer及CXL MXC)及时钟芯片。公司的津逮服务器平台主要由津逮CPU及数据保护和可信计算加速芯片组成。按技术类别区分,高速互连芯片主要分为三大类:内存互连芯片、PCIe/CXL互连芯片和以太网及光互连芯片等。其中,内存互连芯片包括内存接口及模组配套芯片,主要用于提升内存数据访问的速度及可靠性。高速互连芯片是支撑数据中心、服务器及计算机实现高速数据交互的必备芯片,主要解决智能算力系统持续升级背景下各类数据传输的瓶颈。高速互连芯片适配多种标准化通信协议,通过信号处理、架构优化等方式,保障数据在各系统间高效、可靠传输。

公司一代创始人掌舵,发展进程足履实地,股权结构分散

杨崇和博士于2004年与Stephen Tai先生共同创立了澜起科技,任公司董事长兼 首席执行官、首席科学家。杨博士于1990年至1994年在美国国家半导体等公司从 事芯片设计研发工作;于1994年至1996年任上海贝岭新产品研发部负责人。 1997年,杨博士与同仁共同创建了新涛科技,该公司于2001年与IDT公司成功合 并。杨博士于2010年当选美国电气和电子工程师协会会士(IEEE Fellow),并 于2022年晋升为IEEE终身会士(IEEE Life Fellow)。杨博士毕业于美国俄勒 冈州立大学,获电子与计算机工程学硕士及博士学位。

Stephen Tai先生自2004年澜起科技创立至今任公司董事兼总经理。Stephen Tai先生拥有30年的半导体架构、设计和工程管理经验。1994年至1995年曾任 Sigmax Technology公司资深设计工程师;1995年至2003年参与创建了 Marvell科技集团并担任该公司的工程研发总监。Stephen Tai先生毕业于美国约 翰霍普金斯大学,获电子与计算机工程学士学位;之后在美国斯坦福大学获电子工 程学硕士学位。

澜起科技股权结构分散,无实控人。截至公司2025年三季报,公司最大股东为香港中央结算有限公司,持有144,982,812股,占总股本比例12.66%,第二大股东中国电子投资控股有限公司,持有57,894,297股占流通A股比例5.06%,公司无实控人的治理模式有效避免了单一股东对于公司的过度影响,充分发挥了资本市场的股权优势。

公司盈利能力强劲,持续投入研发,期间费用率稳定

2025年前三季度公司营业收入和归母净利润高速增长。公司营业收入由2018年的17.58亿 元增长至2024年的36.39亿元,年复合增速13%;归母净利润由2018年的7.37亿元增长至 2024年的14.12亿元,年复合增速11%。2025年前三季度实现营业收入40.58亿元,同比 增长57.83%,归母净利润16.32亿元,同比增长66.89%,主要系公司互连类芯片出货量 显著增加,推动公司经营业绩较上年同期实现大幅增长。第三季度,受益于AI产业趋势,行 业需求旺盛,公司实现营业收入14.24亿元,同比增长57.22%;实现归属于母公司所有者 的净利润4.73亿元,同比增长22.94%;实现剔除股份支付费用后归属于母公司所有者的净 利润8.11亿元,同比增长105.78%,环比增长10.96%。 

公司具备高效的经营管理体系,2025年前三季度整体费用率相比2020年全年有所下降。 2020年至2025年前三季度,公司财务费用率由-3.07%下降至-4.94%;销售费用率由 4.35%下降至2.02%;管理费用率由10.29%上升至14.58%。研发费用率维持高位, 2025年前三季度达13.14%。

二、内存互连芯片:DDR5技术迭代加速市场渗透,AI时代技术迭代推动需求量+价值量双维度增长

内存互连芯片:包括内存接口芯片和模组配套芯片

内存互连芯片主要应用于服务器领域,部份内存互连芯片亦应用于PC领域。其中,内存接口芯片是服务器内存模组(内存条)的核心逻辑器件,作为服务器CPU存取内存数据的必由通路,其主要作用是提升内存数据访问的速度及稳定性,满足服务器CPU对内存模组日益增长的高性能及大容量需求。内存接口芯片需与内存厂商生产的各种内存颗粒和内存模组进行配套,并通过服务器CPU、内存和OEM厂商针对其功能和性能(如稳定性、运行速度和功耗等)的全方位严格认证,才能进入大规模商用阶段。

内存接口芯片按功能可分为两类:一是寄存时钟缓冲器(RCD,Registering Clock Driver),用来缓冲来自内存控制器的地址、命令、时钟、控制信号;二是数据缓冲器(DB,Data Buffer),用来缓冲来自内存控制器或内存颗粒的数据信号。RCD与DB组成套片,可实现对地址、命令、时钟、控制信号和数据信号的全缓冲。仅采用了RCD芯片对地址、命令、时钟、控制信号进行缓冲的内存模组通常称为RDIMM(寄存双列直插内存模组),而采用了RCD和DB套片对地址、命令、时钟、控制信号及数据信号进行缓冲的内存模组称为LRDIMM(减载双列直插内存模组)。

公司的内存接口芯片广泛应用于国际主流内存、服务器和云计算领域,并占据全球市场的重要份额。此外,根据JEDEC标准,DDR5内存模组上除了内存颗粒及内存接口芯片外,还需要三种配套芯片,分别是串行检测集线器(SPD)、温度传感器(TS)以及电源管理芯片(PMIC)。

RCD/DB:主要用于(L)RDIMM等内存模组,常见于服务器

双列直插式内存模块(DIMM,Dual Inline Memory Module)是一种常见的计算机内存模块化硬件,是在单列直插存储器模块(singleinlinememory module,SIMM)的基础上发展起来的,SIMM提供32位数据通道,而DIMM则提供了64位的数据通道,用于台式机、笔记本电脑和服务器,并由单个印刷电路板上的多个随机存取存储器芯片(RAM,Dynamic Random Access Memory)组成。通常所说的内存条,就是指DIMM系列内存模组。

常见内存模组,还包括RDIMM(带存储器的双列直插式存储模块),其包括用于优化时钟、命令和控制信号的寄存器,通过添加8位奇偶校验信号,实现错误纠正;LRDIMM(低负载双列直插式存储模块)其包括用于优化时钟、命令和控制信号的寄存器通过放置数据缓冲区优化数据信号;UDIMM(无缓冲双列直插式存储模块)其无缓冲区和寄存器,延迟值更小;SODIMM(无缓冲小型双列直插式存储模块)。

MRDIMM:AI拉动服务器高带宽MRDIMM模组新需求

新型高带宽内存模块MRDIMM创造市场增量:基于AI应用对内存带宽的迫切需求,MRDIMM以其优异的带宽性能,预计将成为主流AI服务器系统主内存的优选方案。2025年,MRDIMM开始在下游规模应用,据澜起科技的预测,至2030年其在AI服务器内存模块中的渗透率将达30%,出货量高达53.4百万根,2025年至2030年的年均复合增长率为148.0%。根据弗若斯特沙利文的预测,2025至2030年服务器内存模组出货量CAGR将达到10.8%。

MRDIMM性能强劲,以SK海力士开发的双内存序列架构为例,通过促进两个序列的同时协作,MRDIMM 能够一次向CPU传输128字节的数据,而传统DRAM模块通常需要64字节。每次发送到CPU的数据量增加支持单个DRAM速度的两倍。

芯片大厂开始支持MRDIMM内存以提升AI能力。英特尔发布的至强6性能核处理器,提到其支持MRDIMM技术。且MRDIMM受益最大的应用主要包括HPCG(High Performance Conjugate Gradient)、AMG(Algebraic Multi-Grid)、Xcompact3d这些科学计算类的应用,以及大语言模型推理。其中在大语言模型推理当中,MRDIMM的带宽优势将得到充分的发挥,据Intel的预测,其性能提升在30%以上,因为大模型是确定性的渴求显存/内存容量和带宽的应用场景;英特尔至强6性能核处理器发布会资料显示:在多种工作负载的性能对比中,AI部分的提升幅度最为明显。一般来说,在控制模型参数量并进行低精度量化(int8甚至int5、int4)之后,大语言模型推理时的算力瓶颈已经不太突出,决定并发数量和token响应速度的,主要还是内存的容量和带宽。通过MRDIMM,以及CXL内存扩展带宽将是提升推理性能最有效的方式。这也是目前CPU推理依旧受到重视的原因,除了可获得性、资源弹性外,在内存容量及带宽的扩展上要比VRAM便宜的多。

AI PC/笔记本端的内存模组对SPD/PMIC/CKD亦有需求

2025年5月15日,Rambus公司宣布推出面向下一代人工智能(AI)个人电脑(PC)内存模块的完整客户端芯片组,包含两款用于客户端计算的全新电源管理芯片(PMIC)。PMIC是实现高效供电的关键,能够为先进的计算应用提供突破性的性能表现。这两款业界领先的全新Rambus PMIC分别是适用于LPDDR5CAMM2(LPCAMM2)内存模块的PMIC5200,以及适用于DDR5 CSODIMM和CUDIMM的PMIC5120。这两款PMIC与客户端时钟驱动器(CKD)和串行检测(SPD)集线器共同组成了适用于AI笔记本电脑、台式电脑和工作站内存模块的完整芯片组解决方案。此外,随着这两款全新PMIC的推出,Rambus现在可以为服务器和客户端的所有JEDEC标准DDR5和LPDDR5内存模块提供完整内存接口芯片组。在实际应用中,联想Think Pad P1 Gen7已采用LPCAMM2内存模组。

三、PCIe/CXL互连芯片:Retimer芯片世界第二,CXL池化技术未来可期

公司产品:PCIe Retimer,适用于PCIe总线标准

PCIe(Peripheral Component Interconnect Express)是一种高速串行计算机扩展总线标准,其核心特点 是通过点对点串行通信和差分信号传输实现高带宽、低延迟的数据传输。以下是其工作原理的关键点:1)点对 点架构:每个PCIe设备通过独立的链路(由多个通道组成)直接连接到主板芯片组或CPU,避免了传统总线共 享导致的资源竞争。2)差分信号传输:使用双绞线传输差分信号(正负互补信号),抗电磁干扰能力强,支持 更高的频率和更长的传输距离。3)通道与带宽:每个通道由两对差分信号线(发送和接收)组成,单通道(x1) 带宽双向可达约500MB/s(PCIe3.0);多个通道可组合(如x4、x16),成倍提升带宽。例如,PCIe4.0 x16的理论带宽可达32GB/s。4)分层协议结构。5)基于数据包的传输:数据以“数据包”形式传输(而非传 统总线的固定时序),支持全双工通信(同时收发),效率更高。

PCIe采用的是树型拓扑结构,一般由根复合体(Root Complex),中继器(Repeater),终端设备(Endpoint) 等类型的PCIe设备组成。Root Complex:根复合体是CPU和PCIe总线连接的接口。主要负责存储器域到 PCIe总线域的地址转换,根复合体把来自CPU的request转化成PCIe的4类request(configuration、 memory、I/O、message)并发送给下面的设备。Repeater:中继器是一种信号调节装置,可分为两类: Retimers和Redriver,两者都是常用的PCIe组件,Retimer通过内部时钟重构信号,再恢复后发送出去; Redriver则是通过信号均衡化和预加强等技术,重新加强再发送出去。PCIe Endponit:PCIe终端设备,是 PCIe树型结构的末端节点。比如SSD,网卡、GFX卡等等。

PCIe Retimer芯片是适用于PCIe协议的超高速时序整合芯片,其技术实现和协议交互均需符合PCI-SIG联盟 制定的标准体系。在PCIe4.0时代,澜起科技是全球量产PCIe4.0 Retimer芯片的三家厂商之一;进入 PCIe5.0时代,澜起科技成为全球主要供货PCIe5.0/CXL2.0Retimer芯片的两家厂商之一。目前,澜起科技 已推出了PCIe6.x/CXL3.x Retimer芯片并向客户送样,同时正在积极推进PCIe7.0 Retimer芯片的研发。

超节点架构:英伟达用NVLink-C2C,华为用 Clos 架构连接CPU与其他终端

超节点的定义:一种通过高速总线技术将多台服务器及其GPU/NPU设备紧密互连,形成高带宽域(High Bandwidth Domain,HBD)的纵向扩展系统。超节点的核心技术原理建立在Scale Up(纵向扩展)与Scale Out(横向扩展)两种集群构建方式的创新融合上。Scale Up通过增加单节点内的算力卡数量提升算力密度,而Scale Out则通过增加节点数量扩展集群规模。超节点本质上是一种加强版的Scale Up方案,突破了传统单台服务器的物理限制。

在互连技术方面,超节点采用专有高速总线协议替代传统的PCIe和以太网。以NVIDIA Grace Hopper超级芯片架构为例,其采用NVLink(C2C)互连在Grace CPU和Hopper GPU之间提供了高带宽的直接连接以创建Grace Hopper超级芯片,该芯片专为AI和HPC应用的降速加速而设计。凭借900GB/s的双向带宽,NVLink-C2C以较低的延迟提供了x16 PCIe Gen链路的7倍带宽。据英伟达的研究,NVLink-C2C也仅使用1.3微微焦/比特传输,这比PCIeGen5能效高5倍以上。

又以华为昇腾384超节点,即Atlas 900 A3 SuperPoD为例,该产品基于超节点架构,采用全对等(Peer-to-Peer)UB总线,将384颗NPU+192颗鲲鹏CPU通过无阻塞Clos架构互连,单跳时延<200ns,带宽392GB/s,比传统RoCE提升15倍。3168根光纤+6912个400G光模块实现百纳秒级互连,支持2m以上长距部署,突破了铜缆距离限制。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至