2026年计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库
- 来源:东吴证券
- 发布时间:2026/01/19
- 浏览次数:128
- 举报
计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库【星环科技】.pdf
计算机行业:NVRubin新架构&Agent存储最强方向,GPUNative数据库【星环科技】。存储瓶颈影响AI推理速度。每生成1个Token(一个词),GPU都要把整个过去的对话历史(即KVCache)从显存里读一遍。随着对话变长,KVCache的体积会线性膨胀。这个"读一遍"的过程极其消耗带宽。我们希望AI可以记住跟它进行的每一次对话,现在的做法是把KVCache放在HBM里(因为它够快),但HBM又贵,容量又小,前一代的解决方案是利用NVLink-C2C把GraceCPU的大内存(LPDDR5X)当成GPU的扩展显存用,这个不够用了,第二个方法是数据溢出后,通...
硬件变化:GPU成为存储架构的主宰
颠覆CPU主导时代,GPU全面接管存储IO
AI推理与训练的IO需求差距很大。 AI训练:依赖海量数据的批量传输,单轮数据块尺寸通常在MB级以上,控制路径的延迟占比极低。 AI推理:LLM推理的KV缓存访问粒度仅8KB-4MB,向量数据库检索、推荐系统的特征读取低至64B-8KB,但需要支持数千条并行线程的并发请求。LLM推理的存储需求已突破10TB级,向量数据库和推荐系统的存储规模达到1TB-1PB,这种“小块高频大容量”的访问模式,让传统存储架构不堪重负。
以CPU为中心的数据加载架构已成为GenAI工作负载的瓶颈
AI工作负载的极端并行需求: 为了充分利用现代硬件(如PCIe Gen6)来处理AI(如RAG)的512B小I/O,系统必须维持一个高达20,000+的队列深度(Qd)。 GPU并非瓶颈: GPU的并行架构有能力发出如此海量的并发I/O请求。 真正的瓶颈是CPU软件栈: 问题的根源在于传统的、由CPU驱动的软件栈。这个软件栈习惯于"串行化" (serialize) 或"批处理"(batch) I/O,这会人为地压低系统实际的队列深度 (Qd)。
GPU地位提升,实现控制权的反转
GPU成为“编排器”,取代CPU成为数据访问的控制中心。CPU被“降级”,仅负责辅助性的“内务管理”(house keeping)。 数据访问模式从CPU“推送” (push) 数据块,转变为GPU“拉取” (pull) 数据。GPU只在计算需要时才“按需”(on-demand)从一个统一的分层存储池中抓取它需要的数据。
关键技术实现
通过硬件GPU直连SSD和SCADA软件架构实现GPU地位的提升:GPU直连SSD允许GPU绕过CPU和系统内存,直接、高效地从固态硬盘读取和写入数据,是通过NVMe-of、RDMA、GPUDirect Storage等技术协议实现的一条优化的直接数据通路。 SCADA是一个用于解决AI I/O瓶颈的、可扩展的、生产级的软件架构。通过两个关键技术解决了“CPU软件栈”瓶颈: 1)服务器端:使用 uNVMe (用户态驱动) 绕过内核,实现极致的IOPS。 2)客户端:GPU应用线程成为数据请求的发起者。传输中:“数据路径"协议(可能基于RDMA和GPUDirect)允许数据从服务器存储直接流向GPU显存,最小化CPU负载和延迟。 GPU地位的提升。这个架构实现了“GPU作为I/O编排器”的愿景。GPU应用线程(通过SCADA Client)发起请求,数据(通过DataPath)直接流入GPU,CPU在数据流中被彻底旁路。
硬件方面产业进展
HBF新型存储是未来。2025年8月,被业界誉为"HBM之父"的韩国科学技术院(KAIST)教授金正浩提出“AI时代的力量平衡正从GPU向存储领域转移。在人工智能时代存储器件将扮演日益关键的角色,甚至英伟达未来可能收购存储企业。高带宽闪存(HBF)预计将在2026年初取得突破,并于2027至2028年间正式亮相。”
2025年8月,闪迪与SK海力士签署谅解备忘录,共同制定HBF技术规范并推动标准化进程。双方目标在2026下半年发布HBF样品,首批搭载HBF的AI推理系统预计于2027年初面世。在10月中旬举办的2025 OCP全球峰会上,SK海力士首次展示了搭载HBF技术的"AINB系列"存储产品。
铠侠将与英伟达合作,推出直连 GPU 进行数据交换的SSD 。2025年9月2日铠侠SSD应用技术部门首席工程师福田浩一表示,“将按照英伟达的建议和要求进行开发”。 迄今为止,SSD一般通过CPU(中央处理器)与GPU连接。铠侠将与英伟达合作,开发可直接连接到GPU并进行数据交换的SSD。英伟达表示,与GPU连接的SSD需要达到2亿IOPS,将以2个SSD应对这一需求。计划支持被称为PCIe(PCIExpress)的SSD接口的下下代标准“PCIe 7.0”。
软件变化:GPU-Native的数据库
核心组件层面升级改造
存储引擎的革新。传统的、基于系统内存(DRAM)的缓冲池(Buffer Pool)管理机制效率降低。新的缓存管理器需要直接管理GPU显存和直连 SSD 之间的数据流动。
数据布局优化。为匹配GPU的SIMD(单指令多数据)架构,数据在SSD上可能更倾向采用纯列式或混合式存储格式,并原生支持ApacheArrow等零拷贝内存格式,方便GPU直接消费。
查询执行引擎的重构。 1) 算子的GPU原生实现:扫描(Scan)、连接(Join)、聚合(Aggregation)、排序(Sort)等核心算子需要深度重写为GPU内核,并能直接从SSD流式消费数据。 2)异步、流水线执行:查询计划被组织成高效的GPU内核流水线,当前步骤在GPU计算时,下一步所需的数据已通过直连路径在后台从SSD预取,实现计算与/O的完全重叠。
查询优化器的挑战。成本模型剧变:传统的基于CPU周期和磁盘寻址的代价模型失效。新模型需纳入 GPU计算核心占用率、HBM与SSD间的带宽、PCle传输延迟等新因素。
数据本地性优化。优化器在生成执行计划时,必须优先考虑数据在 GPU显存、直连SSD、网络存储中的位置,尽量将计算调度到离数据最近的处理器上。
软件方面
Hammerspace已经通过更快更可扩展的元数据读取功能以及在GPU服务器直连存储驱动器中的更优数据放置策略,加速了其数据编排平台软件的性能表现。
Cloudian HyperStore:通过RDMA over S3技术,实现对象存储与GPU内存的直接数据传输,使基于S3接口的向量数据库性能提升8倍。
Databricks有跳过CPU,直接让GPU访问普通SSD的产品Delta Cache,收费高达0.55美元/分钟/GB,7%的使用时间,1年1T收费2000万美元。价格是传统数据库的4倍,AI推理效率也是4倍。
报告节选:



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 计算机:通过AI原生,提升驾驶敏捷性和商业价值统一采购平台(英文版).pdf
- 计算机行业:2026全球量子计算产业发展展望.pdf
- 计算机行业OpenClaw:吹响AI Agent时代号角.pdf
- 计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透.pdf
- 计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海.pdf
- 艾瑞咨询:2024年中国虚拟现实(VR)行业研究报告.pdf
- VRMR行业深度分析:VST技术引领头显进化升级,光学显示屏迭代打造硬件基石.pdf
- 维深Wellsenn XR:2024年度全球VRAR产业销量跟踪报告.pdf
- 全球ARVR行业发展趋势报告2025.pdf
- 2024年中国虚拟现实(VR)行业研究报告.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 华为鲲鹏产业体系研究深度报告:鲲鹏展翅,挥下千亿市场.pdf
- 2 计算机行业研究及2020年投资策略(103页).pdf
- 3 国产计算机基础软硬件行业深度报告:重构中国IT产业生态.pdf
- 4 计算机行业深度分析:国产软件大阅兵.pdf
- 5 国产操作系统产业分析报告:国魂所系,任重道远.pdf
- 6 网络安全服务行业研究报告:网络安全行业的制高点
- 7 计算机操作系统的历史演进和未来趋势.pdf
- 8 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf
- 9 计算机行业2020年度投资策略报告(87页).pdf
- 10 2020年计算机行业中期策略:疫情和中美脱钩对行业意味着什么.pdf
- 1 计算机行业2025年三季报业绩综述:业绩趋势向好,关注AI+与信创主题.pdf
- 2 计算机行业从Circle和Coinbase看稳定币产业链:稳定币+RWA,迈向Finternet的关键.pdf
- 3 计算机行业“智能驾驶”系列专题报告:域控制器研究框架.pdf
- 4 计算机行业专题报告:物理AI,AI技术演进新方向,赋能产业智能化升级.pdf
- 5 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 6 计算机行业深度研究报告:字节跳动,深度布局AIGC,竞逐新一轮技术浪潮.pdf
- 7 计算机行业分析:国产算力迎来GB200时刻,AI交换网络是核心增量.pdf
- 8 计算机行业深度报告:脑机接口,从概念到落地,开启交互新时代.pdf
- 9 计算机行业深度研究:软件大革命深度,AI Agent投资宝典.pdf
- 10 计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”.pdf
- 1 计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库【星环科技】.pdf
- 2 计算机行业AI应用系列:3D打印百花齐放,国产厂商持续突破.pdf
- 3 计算机行业:从智谱华章MiniMax IPO看产业机遇,国内AI产业机遇期来临.pdf
- 4 计算机行业专题研究:千问APP正式接入阿里生态,流量模型AI应用产业格局有望重构.pdf
- 5 计算机行业:SpaceX如何值万亿美元?.pdf
- 6 计算机行业AI编程:重塑软件开发新范式,应用生态加速繁荣.pdf
- 7 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf
- 8 计算机行业:AI编程商业化加速,关注本土产业参与方.pdf
- 9 计算机行业:SpaceX,从“变革”中崛起的“星际先行者”.pdf
- 10 计算机行业共享出行:迈向高质量发展,Robotaxi开启新篇章.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
