2025年第51周计算机行业周报：MistraiAI发布Devstral2系列，GPT_5.2定义专家级智能

来源：华鑫证券
发布时间：2025/12/27
浏览次数：53
举报

相关深度报告REPORTS

计算机行业周报：MistraiAI发布Devstral2系列，GPT_5.2定义专家级智能.pdf

计算机行业周报：MistraiAI发布Devstral2系列，GPT_5.2定义专家级智能。算力：算力租赁价格平稳，MistraiAI发布Devstral2系列2025年12月10日，MistralAI发布了专为编程场景设计的开源模型家族Devstral2，并同步推出命令行工具MistralVibeCLI。这一技术迭代不仅将开源编程智能体的能力边界推向新高度，更通过企业级与本地化的双重解决方案设计，为开发者生态提供了兼具性能与实用性的AI编程工具链，成为大语言模型在代码生成领域落地的重要里程碑。Devstral2系列采用密集Transformer架构，是MistralAI针对代码生成、多文件编...

1、算力动态：算力租赁价格平稳， DeepSeek 发布 V3.2 双模型

1.1、 Tokens 跟踪

根据 OpenRouter 公开数据，2025 年 12 月 8 日至 12 月 14 日，周度 token 消耗量有所下降，调用量为 5.78T，环比上周-6.6%。在 tokens 规模 leaderboard 前五名中，xAI 旗下 GrokCodeFast1 以 619Btokens 位居榜首；Google 的 Gemini2.5Flash 以 454B 位列第二； Anthropic 的 ClaudeSonnet4.5 以 431Btokens 排第三；OpenAI 的 GPT-OSS-120B 和 Anthropic 的 ClaudeOpus4.5 分别以 320B、212Btokens 位列第四、第五。从市场份额维度来看，Google 以 189Btokens 占据 20.5%的份额，稳居首位；OpenAI 以 184Btokens 占比 19.9%，位列第二；xAI、Anthropic、Deepseek 则分别以 143B、120B、 74.7Btokens，对应占据 15.5%、12.9%、8.1%的市场份额。

1.2、数据跟踪：算力租赁价格平稳

上周算力租赁价格平稳。具体来看，显卡配置为 A100-40G 中，腾讯云 16 核+96G 价格为 28.64 元/时，阿里云 12 核+94GiB 价格为 31.58 元/时；显卡配置为 A800-80G 中，恒源云 16 核+256G 价格为 7.50 元/时。

1.3、产业动态：MistraiAI 发布 Devstral2 系列，推动大语言模型代码生成落地

2025 年 12 月 10 日，MistralAI 发布了专为编程场景设计的开源模型家族 Devstral2，并同步推出命令行工具 MistralVibeCLI。这一技术迭代不仅将开源编程智能体的能力边界推向新高度，更通过企业级与本地化的双重解决方案设计，为开发者生态提供了兼具性能与实用性的 AI 编程工具链，成为大语言模型在代码生成领域落地的重要里程碑。 Devstral2 系列采用密集 Transformer 架构，是 MistralAI 针对代码生成、多文件编辑与复杂代码库探索场景打造的专用模型，包含旗舰版（Devstral2，123B 参数）与轻量版（DevstralSmall2，24B 参数）两个版本，形成了覆盖企业级算力与消费级硬件的全场景适配体系。该系列最核心的技术特征是 256K 超长上下文窗口，这一设计使其能够处理大规模多文件代码库的关联分析与逻辑生成任务，突破了传统代码大模型在上下文长度上的限制，解决了复杂项目中跨文件依赖、全局逻辑梳理的技术痛点。从功能定位来看，123B 参数的 Devstral2 作为企业级主力模型，擅长工具调用、多文件编辑与复杂代码库探索，可支撑大型软件开发团队的自动化编程需求；24B 参数的 DevstralSmall2 则具备轻量高效的特性，支持在消费级硬件上本地运行，且兼容图像输入能力，适配隐私敏感场景或离线开发环境的需求。在性能评测中，Devstral2 在 SWEbenchVerified 基准测试中取得 72.2 的高分，超越多数开源竞品；同时其成本效率显著优于同参数规模的闭源模型。 Mistral官方指出，Devstral2（123B）和DevstralSmall2（24B）分别比DeepSeekV3.2 小 5 倍和 28 倍，比 KimiK2 小 8 倍和 41 倍。这证明了紧凑型模型可以匹敌甚至超越更大型竞争对手的性能。

与 Devstral2 模型同步推出的 MistralVibeCLI，是 MistralAI 打造端到端编程自动化体系的关键组件。作为开源命令行工具，MistralVibeCLI 以 Devstral2 模型为推理核心，实现了自然语言与代码操作的直接映射，其核心功能可归纳为三方面：其一，自动化项目工程管理。工具能够自动扫描代码仓库的文件结构与 Git 状态，为模型提供准确的上下文，减少开发者在非业务逻辑开发上的时间投入。其二，交互式命令与自定义配置。开发者可通过自然语言执行 Shell 命令、调试代码、配置开发环境，且支持对工具的执行逻辑进行自定义配置，适配不同开发场景的操作习惯。其三，深度上下文理解与安全增强。与传统代码工具仅能处理单文件上下文不同，MistralVibeCLI 依托 Devstral2 的超长上下文能力，可深度理解整个代码库的逻辑关联；同时工具内置输入验证、自动补全与代码审计功能，降低了自动化编程过程中的语法错误与安全风险。

值得注意的是，Devstral2 采用的许可证是一种修改版 MIT 许可证。对比标准的 MIT 许可证，可以看到一个重大差异：新增的收入限制条款。标准版 MIT 极度宽松。只要你保留版权声明，你可以将代码用于任何目的，包括商业用途、修改、分发、闭源发布，没有任何收入或公司规模的限制。Mistral 许可证则在第 2 条中增加了一个巨大的限制条件（毒丸条款）： Youarenotauthorizedtoexerciseanyrightsunderthislicenseiftheglobalconsolidatedmo nthlyrevenueofyourcompany...exceeds$20million...fortheprecedingmonth.即如果你的公司全球合并月收入超过 2000 万美元，你将无权行使本许可证下的任何权利。也就是说，超过收入门槛的公司必须联系 MistralAI 购买商业授权，或者使用他们的付费 API 服务。并且这一限制不仅适用于原模型，还明确延伸到了 derivatives,modifications,orcombinedworks（衍生品、修改版或结合作品）。这意味着如果你基于这个模型微调了一个新模型，大公司依然不能免费使用你的微调版。

Mistral 目前正通过其 API 免费提供 Devstral2。免费期结束后，API 定价为： Devstral2 每百万 token$0.40/$2.00（输入/输出）；DevstralSmall2 为$0.10/$0.30。他们还宣布已与智能体工具 KiloCode 和 Cline 合作，将 Devstral2 带入用户现有的开发环境中。MistralVibeCLI 也已作为 Zed 的扩展程序提供，因此用户可以直接在 IDE 内部使用它。

2、 AI 应用动态：Perplexity 周时长环比 +10.58%，GPT-5.2 定义专家级智能

2.1、周流量跟踪：Perplexity 周时长环比+10.58%

本期（2025.12.05-2025.12.11）AI 相关网站流量数据：访问量前三位分别为 ChatGPT （1327.0M）、Bing（780.4M）和 Gemini（391.7M），访问量环比增速第一为 Gemini （4.56%）；平均停留时长前三位分别为 Character.AI（00:18:18）、Discord（00:10:41）和 Kimi（00:08:38）;平均停留时长环比增速第一为 Perplexity（10.58%）。

2.2、产业动态：模型实力再突破，GPT-5.2 定义专家级智能

2025 年 12 月 12 日，OpenAI 正式发布了其新一代模型系列 GPT-5.2。此次发布正值该公司成立十周年之际，标志着其在通用人工智能发展道路上又迈出了坚实一步。新推出的模型家族包括即时版 GPT‑5.2Instant、思考版 GPT‑5.2Thinking 以及专业版 GPT‑5.2Pro，旨在全方位满足从日常办公到深度专业任务的不同需求，并在多项基准测试中展现出卓越性能，特别是在处理高难度知识型工作方面表现突出。

根据 OpenAI 公布的评估数据，GPT-5.2 系列在多个关键基准上实现了显著提升。在 SWE-BenchPro 测试中，模型取得了 55.6%的得分，创造了新的记录。在 ARC-AGI-2 评估中， GPT-5.2Pro 更是以 52.9%的优异成绩位居榜首。特别值得关注的是，在 GDPval 测试中， GPT-5.2 系列首次在 44 种职业任务上的表现超越了人类行业专家水平，在 70.9%的情况下其产出结果被评定为优于或等同于顶尖专业人士。这些进步表明，该模型不仅能够高效协助完成诸如财务报表整理、演示文稿制作、代码编写等常规工作，还在处理需要复杂逻辑与多步骤推理的专业项目上展现出更强的可靠性与准确性。

在技术规格方面，GPT-5.2 系列支持高达 40 万个 Token 的上下文窗口，最大输出长度达到 12.8 万 Token，能够顺畅处理超长文本与复杂的多轮对话。其知识库已更新至 2025 年 8 月 31 日，确保了模型对世界最新动态的掌握。此外，该系列模型还增强了对视觉内容的理解能力，在图表解析、界面识别等任务上的错误率相较前代大幅降低，这对于金融、设计、工程等依赖视觉信息的工作流程具有重要意义。在长上下文推理任务中，模型在高达 256KToken 的测试中达到了接近百分之百的准确率，使其能够胜任深度文档分析、多源信息综合等复杂工作。

尽管模型能力全面提升，但其使用成本也有所上升。据披露，GPT-5.2 的输入输出 Token 价格较前代提高了约 40%。然而，由于模型在任务执行中表现出更高的 Token 效率，因此在多项综合评价中，其整体性价比反而被认为更具优势。目前，付费用户可通过 ChatGPT 的相关套餐优先体验新模型，而开发者也可通过相应的 API 进行调用。在编程能力方面，GPT-5.2系列同样树立了新的标杆。除了在SWE-BenchPro上的突破，其在已验证的 SWE-bench 测试中也获得了 80%的高分，这意味着它能够更可靠地进行生产环境代码调试、功能实现与大型代码库重构。早期测试反馈显示，该模型已成为全栈工程师的得力助手，尤其擅长处理包含复杂或非常规用户界面，如 3D 元素的前端开发任务。通过简单的提示词，模型便能生成具备交互功能的海浪模拟网页、节日贺卡制作器或动态打字游戏等单页应用，展示了其强大的端到端实现能力。

GPT-5.2 在减少“幻觉”方面取得了进展。在一组经过处理的真实用户查询测试中，其产生错误回答的比例相比前代模型降低了约 30%，这极大地增强了其在研究、分析、决策支持等严肃知识工作中的可靠性。与此同时，模型在工具调用与端到端工作流管理上的能力也得到加强。在涉及多步骤、多系统协调的客户服务模拟场景中，GPT-5.2 能够更完整地处理从航班重新预订、特殊需求安排到赔偿协调的全链条任务，减少了流程中断，提升了执行效率。

在推动科学研究方面，GPT-5.2 系列也展现出巨大潜力。在研究生水平的 GPQADiamond 基准测试中，GPT-5.2Pro 达到了 93.2%的得分。在协助解决开放性的学术问题中，模型也已能扮演更积极的角色。例如，在一项针对统计学习理论中最大似然估计量学习曲线单调性问题的研究中，GPT-5.2Pro 在人类研究者未提供具体证明策略或大纲的情况下，独立完成了关键证明步骤，并由人类负责后续的验证与论文撰写工作。这种协作模式预示着人工智能在加速数学与科学探索方面可能开启新的范式。GPT-5.2 系列的发布，不仅是 OpenAI 在技术长征中的最新成果，也进一步强化了人工智能作为强大辅助工具，在提升专业工作效率、激发科学创新乃至重塑工作流程方面的关键地位。

3、 AI 融资动向：Fal.ai 完成 1.4 亿美元融资，巩固 AI 内容生成设施地位

2025 年 12 月 10 日，多模态 AI 平台 Fal.ai 宣布完成 1.4 亿美元 D 轮融资，公司估值达到 45 亿美元。本轮由红杉资本(Sequoia)领投，KleinerPerkins 跟投，新进投资者 AlkeonCapital 和 NVIDIA 的风险投资部门 NVentures 参投，现有投资者包括 AndreessenHorowitz(a16z) 、 KindredVentures 、 Meritech 、 BessemerVenturePartners、NotableCapital、ShopifyVentures 和 SalesforceVentures 继续参投支持。该轮融资巩固了 fal 作为 AI 生成内容基础设施层在开发者、企业和创意生态系统中的地位。 Fal.ai 成立于 2021 年，由 BurkayGur 和 GorkemYurtseven 共同创立，专注于 AI 生成音频、视频和图像领域。其云平台提供超过 600 个优化用于生成图像、音频和视频的 AI 模型，其中包括 OpenAIGroupPBC 的 Sora2 和 GoogleLLC 上个月发布的 NanoBananaPro 图像生成器，以及大量开源算法。目前，Fal.ai 已拥有数百家企业客户，平台用户超过 200 万开发者。截至 2025 年 10 月，公司 ARR 已超过 2 亿美元。自 2024 年以来，公司收入增长超过三倍，平台用户数量持续保持在 200 万开发者以上。自 7 月份完成 C 轮融资后，公司在四个月内运营收入翻了一番。每月提供数十亿实时生成的资产，涵盖图像、视频、音频和 3D 内容。开发者可通过统一的 API 访问 Fal 云平台的模型，这一设计免除了学习各类算法技术细节的繁琐，简化了模型切换流程。将应用程序从某一 Fal托管模型迁移至另一模型时，无需进行大量代码修改，因为 API 始终保持一致。若开发者的需求无法通过 Fal 目录内的算法得到满足，他们可在名为 FalServerless 的服务上部署自定义模型。该服务能近乎即时地启动配备数千个图形处理单元的集群，确保客户工作负载能够迅速扩展，以应对突发的使用高峰。

4、行情复盘

上周（12.8-12.12 日），AI 应用指数/AI 算力指数/万得全 A/中证红利日涨幅最大值分别为 1.22%/2.28%/1.04%/0.09%，AI 应用指数/AI 算力指数/万得全 A/中证红利日跌幅最大值分别为-1.93%/-2.08%/-1.10%/-0.92%。AI 算力指数内部，开普云以+21.30%录得上周最大涨幅，天源迪科以-14.01%录得上周最大跌幅。AI 应用指数内部，淳中科技以+13.90%录得上周最大涨幅，恒银科技以-13.62%录得上周最大跌幅。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

2025年第51周计算机行业周报：MistraiAI发布Devstral2系列，GPT_5.2定义专家级智能

计算机行业周报：MistraiAI发布Devstral2系列，GPT_5.2定义专家级智能.pdf

1、 算 力 动 态 ： 算 力 租 赁 价 格 平 稳 ， DeepSeek 发布 V3.2 双模型

2、 AI 应用动态：Perplexity 周时长环比 +10.58%，GPT-5.2 定义专家级智能

3、 AI 融资动向：Fal.ai 完成 1.4 亿美元融 资，巩固 AI 内容生成设施地位

4、 行情复盘

1、算力动态：算力租赁价格平稳， DeepSeek 发布 V3.2 双模型

3、 AI 融资动向：Fal.ai 完成 1.4 亿美元融资，巩固 AI 内容生成设施地位

4、行情复盘