通信行业专题研究：DeepSeek算力效率提升≠算力通缩，国产算力需求方兴未艾.pdf

上传者：v*****
时间：2025/03/24
热度：460
0人点赞
举报

通信行业专题研究：DeepSeek算力效率提升≠算力通缩，国产算力需求方兴未艾。DeepSeek 通过大规模专家并行与计算通信重叠提升算力效率：大规模专家并行模式下，专家参数被存储在多个GPU中，集群处理并行请求能力得到增强，GPU算力资源利用率也得到了提高。但在此模式下，通信耗时增加，因此DeepSeek还采用算通信重叠策略以缓解该问题。我们认为AI大模型具有规模效应：通过底层架构优化后，伴随批量大小的增加，计算与通信的时间边际下降，吞吐率得到提升。因此大规模集群能提高算力利用率。

参考DeepSeek，我们认为MaaS厂商具有盈利潜力，率先实现规模效应的云厂商将脱颖而出：

我们对DeepSeek 披露的545%高利润率进行了拆解，以进一步分析利润率的影响因素。545%是成本利润率，对应84.5% 的收入利润率。将GPU 租赁成本在总成本中的占比、付费率调至合理水平后，我们认为公司实际利润率或低于84.5%。付费率对公司利润率影响较大，伴随付费率的提升，公司利润率有望持续攀升。若能将付费率提升至40%+，则公司的利润率有望达20%+。根据对DeepSeek的利润率分析，我们认为MaaS模式具有盈利潜力。拥有大规模集群、能形成高用户并发的公有云厂商有望形成规模效应。

针对算力之争，我们认为算力效率是新的Scaling Law方向，多模态与AI Agent将打开算力的成长空间：

我们就DeepSeek 的模型参数量、数据规模、峰值倍数、单卡算力、单卡利用率等关键指标进行了详细的拆解，发现 DeepSeek 低算力的原因在于：1）低峰值倍数：未设置较大的算力冗余（峰值倍数仅1.2），一定程度上牺牲了用户体验；2）超高的算力效率，具体体现在单次推理激活的模型参数量（单次推理仅激活370亿参数）、高单卡利用率（H800 单卡利用率高达77%）。市场担心DeepSeek仅使用1814个H800就支持了约2500万DAU 会证伪算力需求，但我们认为伴随峰值倍数的提高、数据规模的扩大，算力需求有望持续提升。高算力效率不等于算力通缩，“参数量*效率*数据规模”才是新的scaling law方向。从远期看，多品类APP接入AI大模型有望带来用户数的增长，多模态、AI Agent 有望带来单次请求调用tokens数量的增加，这都将带动算力需求的提升。因此我们持续看好算力链。