中国互联网行业第二波DeepSeek冲击：V3.2改写中国云生态与芯片生态的推理经济学.pdf

上传者：9*****
时间：2025/12/08
热度：93
0人点赞
举报

中国互联网行业第二波DeepSeek冲击：V3.2改写中国云生态与芯片生态的推理经济学。我们认为，DeepSeek V3.2 的发布标志着国内 AI 市场迎来第二波“ DeepSeek 冲击”：以国内适中的价格即可获得接近前沿模型的开源推理能力，因为 DeepSeek 将模型 API 降价 30-70%，同时长上下文推理可能节省 6-10 倍的工作量。此外，V3.2-Exp 是率先在首日便针对非 CUDA 生态，包括华为的 CANN 堆栈和 Ascend 硬件以及寒武纪 vLLM-MLU 和海光 DTK，进行优化的国产主流前沿模型之一。我们认为这一最新进展利好中国 AI 生态的大多数利益相关者（即云运营商、AI 芯片制造商、 AI 服务器制造商、AI 智能体平台和 SaaS 开发商等），但其他大语言模型开发商除外。我们预计 V3.2 模型将在未来几个季度进一步提升生成式 AI 在中国的普及率。在摩根大通覆盖的中国 AI 行业，受益者包括：阿里巴巴、腾讯、百度、中微公司、北方华创、华勤技术和浪潮信息。

事件——DeepSeek V3.2发布与改写价格

近日 DeepSeek 发布了 DeepSeek-V3.2 和 V3.2-Speciale，作为 2025 年 9 月 29 日首次发布的实验性 V3.2-Exp 模型的后续产品。V3.2 模型保留了 V3.1-Terminus 的混合专家（MoE）架构主体，但通过持续训练引入了 DeepSeek 稀疏注意力机制（DSA），这是唯一的架构变动，减少了长上下文计算，同时保持了在公开基准测试中的水准。 V3.2 被明确定位成“为 Agent （智能体）构建的推理优先模型”：它集成了“思考+工具调用”，因此思维链和工具调用（API、搜索、代码执行）可以在单一轨迹中交错，已在大约 1,800 个合成智能体环境和大约 8.5 万个复杂指令上进行训练。Speciale 版本放宽了长度和计算限制，推进奥林匹克级数学竞赛成绩和竞争性编程性能，在多个推理基准上媲美 Gemini 3.0 Pro 和 GPT-5 级系统。经济影响源于效率和价格。DSA 将长序列的计算复杂度从平方级降至准线性级，当长度为 128k tokens 时，对比 V3.1-Terminus，推理速度提升 2-3 倍，GPU 内存占用减少约 30-40%，但性能相当。DeepSeek 因此实现了 API 结构性降价——每百万 tokens 的输入/输出价格已分别降至 0.28 美元/0.42 美元，而 V3.1 Reasoning（2025 年 9 月发布的模型）分别为 0.42 美元/1.34 美元，R1（2025 年 1 月发布的模型）分别为 1.35 美元 /4.00 美元。根据第三方和硬件供应商的基准，这意味着输入成本对比 V3.1 降低 33% ，输出成本降低 69%，部分工作负载的长上下文推理成本降低了 6-10 倍。我们认为，这标志着中国 AI 市场迎来第二波“DeepSeek 冲击”：以国内适中的价格即可获得接近前沿模型的开源推理能力。