中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf

  • 上传者:9*****
  • 时间:2025/12/08
  • 热度:93
  • 0人点赞
  • 举报

中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学。我们认为,DeepSeek V3.2 的发布标志着国内 AI 市场迎来第二波“ DeepSeek 冲击”:以国内适中的价格即可获得接近前沿模型的开源推理 能力,因为 DeepSeek 将模型 API 降价 30-70%,同时长上下文推理可能 节省 6-10 倍的工作量。此外,V3.2-Exp 是率先在首日便针对非 CUDA 生态,包括华为的 CANN 堆栈和 Ascend 硬件以及寒武纪 vLLM-MLU 和 海光 DTK,进行优化的国产主流前沿模型之一。我们认为这一最新进展 利好中国 AI 生态的大多数利益相关者(即云运营商、AI 芯片制造商、 AI 服务器制造商、AI 智能体平台和 SaaS 开发商等),但其他大语言模 型开发商除外。我们预计 V3.2 模型将在未来几个季度进一步提升生成式 AI 在中国的普及率。在摩根大通覆盖的中国 AI 行业,受益者包括:阿 里巴巴、腾讯、百度、中微公司、北方华创、华勤技术和浪潮信息。

事件——DeepSeek V3.2发布与改写价格

近日 DeepSeek 发布了 DeepSeek-V3.2 和 V3.2-Speciale,作为 2025 年 9 月 29 日首次发布的实验性 V3.2-Exp 模型的后续产品。V3.2 模型保留了 V3.1-Terminus 的混合专家(MoE)架构主体,但通过持续训练引入了 DeepSeek 稀疏注意力机制(DSA),这是唯一的架构变动,减少了长上 下文计算,同时保持了在公开基准测试中的水准。 V3.2 被明确定位成“为 Agent (智能体)构建的推理优先模型”:它集 成了“思考+工具调用”,因此思维链和工具调用(API、搜索、代码执 行)可以在单一轨迹中交错,已在大约 1,800 个合成智能体环境和大约 8.5 万个复杂指令上进行训练。Speciale 版本放宽了长度和计算限制,推 进奥林匹克级数学竞赛成绩和竞争性编程性能,在多个推理基准上媲美 Gemini 3.0 Pro 和 GPT-5 级系统。 经济影响源于效率和价格。DSA 将长序列的计算复杂度从平方级降至准 线性级,当长度为 128k tokens 时,对比 V3.1-Terminus,推理速度提升 2-3 倍,GPU 内存占用减少约 30-40%,但性能相当。DeepSeek 因此实现 了 API 结构性降价——每百万 tokens 的输入/输出价格已分别降至 0.28 美元/0.42 美元,而 V3.1 Reasoning(2025 年 9 月发布的模型)分别为 0.42 美元/1.34 美元,R1(2025 年 1 月发布的模型)分别为 1.35 美元 /4.00 美元。 根据第三方和硬件供应商的基准,这意味着输入成本对比 V3.1 降低 33% ,输出成本降低 69%,部分工作负载的长上下文推理成本降低了 6-10 倍 。我们认为,这标志着中国 AI 市场迎来第二波“DeepSeek 冲击”:以 国内适中的价格即可获得接近前沿模型的开源推理能力。

1页 / 共13
中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf第1页 中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf第2页 中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf第3页 中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf第4页 中国互联网行业第二波DeepSeek冲击:V3.2改写中国云生态与芯片生态的推理经济学.pdf第5页
  • 格式:pdf
  • 大小:1.5M
  • 页数:13
  • 价格: 4积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至