2025年第51周计算机行业周报:MistraiAI发布Devstral2系列,GPT_5.2定义专家级智能
- 来源:华鑫证券
- 发布时间:2025/12/27
- 浏览次数:53
- 举报
计算机行业周报:MistraiAI发布Devstral2系列,GPT_5.2定义专家级智能.pdf
计算机行业周报:MistraiAI发布Devstral2系列,GPT_5.2定义专家级智能。算力:算力租赁价格平稳,MistraiAI发布Devstral2系列2025年12月10日,MistralAI发布了专为编程场景设计的开源模型家族Devstral2,并同步推出命令行工具MistralVibeCLI。这一技术迭代不仅将开源编程智能体的能力边界推向新高度,更通过企业级与本地化的双重解决方案设计,为开发者生态提供了兼具性能与实用性的AI编程工具链,成为大语言模型在代码生成领域落地的重要里程碑。Devstral2系列采用密集Transformer架构,是MistralAI针对代码生成、多文件编...
1、 算 力 动 态 : 算 力 租 赁 价 格 平 稳 , DeepSeek 发布 V3.2 双模型
1.1、 Tokens 跟踪
根据 OpenRouter 公开数据,2025 年 12 月 8 日至 12 月 14 日,周度 token 消耗量有所下 降,调用量为 5.78T,环比上周-6.6%。在 tokens 规模 leaderboard 前五名中,xAI 旗下 GrokCodeFast1 以 619Btokens 位居榜首;Google 的 Gemini2.5Flash 以 454B 位列第二; Anthropic 的 ClaudeSonnet4.5 以 431Btokens 排第三;OpenAI 的 GPT-OSS-120B 和 Anthropic 的 ClaudeOpus4.5 分别以 320B、212Btokens 位列第四、第五。 从市场份额维度来看,Google 以 189Btokens 占据 20.5%的份额,稳居首位;OpenAI 以 184Btokens 占比 19.9%,位列第二;xAI、Anthropic、Deepseek 则分别以 143B、120B、 74.7Btokens,对应占据 15.5%、12.9%、8.1%的市场份额。

1.2、数据跟踪:算力租赁价格平稳
上周算力租赁价格平稳。具体来看,显卡配置为 A100-40G 中,腾讯云 16 核+96G 价格 为 28.64 元/时,阿里云 12 核+94GiB 价格为 31.58 元/时;显卡配置为 A800-80G 中,恒源 云 16 核+256G 价格为 7.50 元/时。
1.3、产业动态:MistraiAI 发布 Devstral2 系列,推动 大语言模型代码生成落地
2025 年 12 月 10 日,MistralAI 发布了专为编程场景设计的开源模型家族 Devstral2, 并同步推出命令行工具 MistralVibeCLI。这一技术迭代不仅将开源编程智能体的能力边界 推向新高度,更通过企业级与本地化的双重解决方案设计,为开发者生态提供了兼具性能 与实用性的 AI 编程工具链,成为大语言模型在代码生成领域落地的重要里程碑。 Devstral2 系列采用密集 Transformer 架构,是 MistralAI 针对代码生成、多文件编辑 与复杂代码库探索场景打造的专用模型,包含旗舰版(Devstral2,123B 参数)与轻量版 (DevstralSmall2,24B 参数)两个版本,形成了覆盖企业级算力与消费级硬件的全场景适 配体系。该系列最核心的技术特征是 256K 超长上下文窗口,这一设计使其能够处理大规模 多文件代码库的关联分析与逻辑生成任务,突破了传统代码大模型在上下文长度上的限制, 解决了复杂项目中跨文件依赖、全局逻辑梳理的技术痛点。 从功能定位来看,123B 参数的 Devstral2 作为企业级主力模型,擅长工具调用、多文 件编辑与复杂代码库探索,可支撑大型软件开发团队的自动化编程需求;24B 参数的 DevstralSmall2 则具备轻量高效的特性,支持在消费级硬件上本地运行,且兼容图像输入 能力,适配隐私敏感场景或离线开发环境的需求。在性能评测中,Devstral2 在 SWEbenchVerified 基准测试中取得 72.2 的高分,超越多数开源竞品;同时其成本效率显著优 于同参数规模的闭源模型。 Mistral官方指出,Devstral2(123B)和DevstralSmall2(24B)分别比DeepSeekV3.2 小 5 倍和 28 倍,比 KimiK2 小 8 倍和 41 倍。这证明了紧凑型模型可以匹敌甚至超越更大型 竞争对手的性能。
与 Devstral2 模型同步推出的 MistralVibeCLI,是 MistralAI 打造端到端编程自动化 体系的关键组件。作为开源命令行工具,MistralVibeCLI 以 Devstral2 模型为推理核心, 实现了自然语言与代码操作的直接映射,其核心功能可归纳为三方面: 其一,自动化项目工程管理。工具能够自动扫描代码仓库的文件结构与 Git 状态,为模 型提供准确的上下文,减少开发者在非业务逻辑开发上的时间投入。其二,交互式命令与 自定义配置。开发者可通过自然语言执行 Shell 命令、调试代码、配置开发环境,且支持对 工具的执行逻辑进行自定义配置,适配不同开发场景的操作习惯。其三,深度上下文理解 与安全增强。与传统代码工具仅能处理单文件上下文不同,MistralVibeCLI 依托 Devstral2 的超长上下文能力,可深度理解整个代码库的逻辑关联;同时工具内置输入验证、自动补 全与代码审计功能,降低了自动化编程过程中的语法错误与安全风险。
值得注意的是,Devstral2 采用的许可证是一种修改版 MIT 许可证。对比标准的 MIT 许 可证,可以看到一个重大差异:新增的收入限制条款。标准版 MIT 极度宽松。只要你保留版 权声明,你可以将代码用于任何目的,包括商业用途、修改、分发、闭源发布,没有任何 收入或公司规模的限制。Mistral 许可证则在第 2 条中增加了一个巨大的限制条件(毒丸条 款): Youarenotauthorizedtoexerciseanyrightsunderthislicenseiftheglobalconsolidatedmo nthlyrevenueofyourcompany...exceeds$20million...fortheprecedingmonth.即如果你的 公司全球合并月收入超过 2000 万美元,你将无权行使本许可证下的任何权利。也就是说, 超过收入门槛的公司必须联系 MistralAI 购买商业授权,或者使用他们的付费 API 服务。 并 且 这 一 限 制 不 仅 适 用 于 原 模 型 , 还 明 确 延 伸 到 了 derivatives,modifications,orcombinedworks(衍生品、修改版或结合作品)。这意味着 如果你基于这个模型微调了一个新模型,大公司依然不能免费使用你的微调版。

Mistral 目前正通过其 API 免费提供 Devstral2。免费期结束后,API 定价为: Devstral2 每百万 token$0.40/$2.00(输入/输出);DevstralSmall2 为$0.10/$0.30。他 们还宣布已与智能体工具 KiloCode 和 Cline 合作,将 Devstral2 带入用户现有的开发环境 中。MistralVibeCLI 也已作为 Zed 的扩展程序提供,因此用户可以直接在 IDE 内部使用它。
2、 AI 应用动态:Perplexity 周时长环比 +10.58%,GPT-5.2 定义专家级智能
2.1、 周流量跟踪:Perplexity 周时长环比+10.58%
本期(2025.12.05-2025.12.11)AI 相关网站流量数据:访问量前三位分别为 ChatGPT (1327.0M)、Bing(780.4M)和 Gemini(391.7M),访问量环比增速第一为 Gemini (4.56%);平均停留时长前三位分别为 Character.AI(00:18:18)、Discord(00:10:41) 和 Kimi(00:08:38);平均停留时长环比增速第一为 Perplexity(10.58%)。
2.2、 产业动态:模型实力再突破,GPT-5.2 定义专家级 智能
2025 年 12 月 12 日,OpenAI 正式发布了其新一代模型系列 GPT-5.2。此次发布正值该 公司成立十周年之际,标志着其在通用人工智能发展道路上又迈出了坚实一步。新推出的 模型家族包括即时版 GPT‑5.2Instant、思考版 GPT‑5.2Thinking 以及专业版 GPT‑5.2Pro, 旨在全方位满足从日常办公到深度专业任务的不同需求,并在多项基准测试中展现出卓越 性能,特别是在处理高难度知识型工作方面表现突出。
根据 OpenAI 公布的评估数据,GPT-5.2 系列在多个关键基准上实现了显著提升。在 SWE-BenchPro 测试中,模型取得了 55.6%的得分,创造了新的记录。在 ARC-AGI-2 评估中, GPT-5.2Pro 更是以 52.9%的优异成绩位居榜首。特别值得关注的是,在 GDPval 测试中, GPT-5.2 系列首次在 44 种职业任务上的表现超越了人类行业专家水平,在 70.9%的情况下其 产出结果被评定为优于或等同于顶尖专业人士。这些进步表明,该模型不仅能够高效协助 完成诸如财务报表整理、演示文稿制作、代码编写等常规工作,还在处理需要复杂逻辑与 多步骤推理的专业项目上展现出更强的可靠性与准确性。
在技术规格方面,GPT-5.2 系列支持高达 40 万个 Token 的上下文窗口,最大输出长度 达到 12.8 万 Token,能够顺畅处理超长文本与复杂的多轮对话。其知识库已更新至 2025 年 8 月 31 日,确保了模型对世界最新动态的掌握。此外,该系列模型还增强了对视觉内容的 理解能力,在图表解析、界面识别等任务上的错误率相较前代大幅降低,这对于金融、设 计、工程等依赖视觉信息的工作流程具有重要意义。在长上下文推理任务中,模型在高达 256KToken 的测试中达到了接近百分之百的准确率,使其能够胜任深度文档分析、多源信息 综合等复杂工作。
尽管模型能力全面提升,但其使用成本也有所上升。据披露,GPT-5.2 的输入输出 Token 价格较前代提高了约 40%。然而,由于模型在任务执行中表现出更高的 Token 效率, 因此在多项综合评价中,其整体性价比反而被认为更具优势。目前,付费用户可通过 ChatGPT 的相关套餐优先体验新模型,而开发者也可通过相应的 API 进行调用。 在编程能力方面,GPT-5.2系列同样树立了新的标杆。除了在SWE-BenchPro上的突破, 其在已验证的 SWE-bench 测试中也获得了 80%的高分,这意味着它能够更可靠地进行生产环 境代码调试、功能实现与大型代码库重构。早期测试反馈显示,该模型已成为全栈工程师 的得力助手,尤其擅长处理包含复杂或非常规用户界面,如 3D 元素的前端开发任务。通过 简单的提示词,模型便能生成具备交互功能的海浪模拟网页、节日贺卡制作器或动态打字 游戏等单页应用,展示了其强大的端到端实现能力。
GPT-5.2 在减少“幻觉”方面取得了进展。在一组经过处理的真实用户查询测试中,其 产生错误回答的比例相比前代模型降低了约 30%,这极大地增强了其在研究、分析、决策支 持等严肃知识工作中的可靠性。与此同时,模型在工具调用与端到端工作流管理上的能力 也得到加强。在涉及多步骤、多系统协调的客户服务模拟场景中,GPT-5.2 能够更完整地处 理从航班重新预订、特殊需求安排到赔偿协调的全链条任务,减少了流程中断,提升了执 行效率。
在推动科学研究方面,GPT-5.2 系列也展现出巨大潜力。在研究生水平的 GPQADiamond 基准测试中,GPT-5.2Pro 达到了 93.2%的得分。在协助解决开放性的学术问题中,模型也已 能扮演更积极的角色。例如,在一项针对统计学习理论中最大似然估计量学习曲线单调性 问题的研究中,GPT-5.2Pro 在人类研究者未提供具体证明策略或大纲的情况下,独立完成 了关键证明步骤,并由人类负责后续的验证与论文撰写工作。这种协作模式预示着人工智 能在加速数学与科学探索方面可能开启新的范式。GPT-5.2 系列的发布,不仅是 OpenAI 在 技术长征中的最新成果,也进一步强化了人工智能作为强大辅助工具,在提升专业工作效 率、激发科学创新乃至重塑工作流程方面的关键地位。
3、 AI 融资动向:Fal.ai 完成 1.4 亿美元融 资,巩固 AI 内容生成设施地位
2025 年 12 月 10 日,多模态 AI 平台 Fal.ai 宣布完成 1.4 亿美元 D 轮融资,公司估 值达到 45 亿美元。本轮由红杉资本(Sequoia)领投,KleinerPerkins 跟投,新进投资者 AlkeonCapital 和 NVIDIA 的 风 险 投 资 部 门 NVentures 参 投 , 现 有 投 资 者 包 括 AndreessenHorowitz(a16z) 、 KindredVentures 、 Meritech 、 BessemerVenturePartners、NotableCapital、ShopifyVentures 和 SalesforceVentures 继续参投支持。该轮融资巩固了 fal 作为 AI 生成内容基础设施层在开发者、企业和创意 生态系统中的地位。 Fal.ai 成立于 2021 年,由 BurkayGur 和 GorkemYurtseven 共同创立,专注于 AI 生 成音频、视频和图像领域。其云平台提供超过 600 个优化用于生成图像、音频和视频的 AI 模型,其中包括 OpenAIGroupPBC 的 Sora2 和 GoogleLLC 上个月发布的 NanoBananaPro 图像生成器,以及大量开源算法。 目前,Fal.ai 已拥有数百家企业客户,平台用户超过 200 万开发者。截至 2025 年 10 月,公司 ARR 已超过 2 亿美元。自 2024 年以来,公司收入增长超过三倍,平台用户数量 持续保持在 200 万开发者以上。自 7 月份完成 C 轮融资后,公司在四个月内运营收入翻了 一番。每月提供数十亿实时生成的资产,涵盖图像、视频、音频和 3D 内容。 开发者可通过统一的 API 访问 Fal 云平台的模型,这一设计免除了学习各类算法技术 细节的繁琐,简化了模型切换流程。将应用程序从某一 Fal托管模型迁移至另一模型时, 无需进行大量代码修改,因为 API 始终保持一致。若开发者的需求无法通过 Fal 目录内的 算法得到满足,他们可在名为 FalServerless 的服务上部署自定义模型。该服务能近乎即 时地启动配备数千个图形处理单元的集群,确保客户工作负载能够迅速扩展,以应对突 发的使用高峰。
4、 行情复盘
上周(12.8-12.12 日),AI 应用指数/AI 算力指数/万得全 A/中证红利日涨幅最大值分 别为 1.22%/2.28%/1.04%/0.09%,AI 应用指数/AI 算力指数/万得全 A/中证红利日跌幅最大 值分别为-1.93%/-2.08%/-1.10%/-0.92%。AI 算力指数内部,开普云以+21.30%录得上周最 大涨幅,天源迪科以-14.01%录得上周最大跌幅。AI 应用指数内部,淳中科技以+13.90%录 得上周最大涨幅,恒银科技以-13.62%录得上周最大跌幅。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 计算机:通过AI原生,提升驾驶敏捷性和商业价值统一采购平台(英文版).pdf
- 计算机行业:2026全球量子计算产业发展展望.pdf
- 计算机行业OpenClaw:吹响AI Agent时代号角.pdf
- 计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透.pdf
- 计算机行业周报:openClaw推动AI产业进入Agent时代.pdf
- 正泰安能:向设计要效益:AI自动化设计的实践与回报.pdf
- 艺恩报告:智驾未来:AI重塑汽车消费新纪元.pdf
- 清鹏算电:AI与电力市场应用探索——清鹏能源大模型智能体实践与展望.pdf
- 启信慧眼:全球布局洞见先行:构建AI时代的供应链韧性-2026供应链风控白皮书.pdf
- 浪涌成潮,以AI叙事开启增长万象.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 华为鲲鹏产业体系研究深度报告:鲲鹏展翅,挥下千亿市场.pdf
- 2 计算机行业研究及2020年投资策略(103页).pdf
- 3 国产计算机基础软硬件行业深度报告:重构中国IT产业生态.pdf
- 4 计算机行业深度分析:国产软件大阅兵.pdf
- 5 国产操作系统产业分析报告:国魂所系,任重道远.pdf
- 6 网络安全服务行业研究报告:网络安全行业的制高点
- 7 计算机操作系统的历史演进和未来趋势.pdf
- 8 计算机行业专题报告:多模态大模型技术演进及研究框架.pdf
- 9 计算机行业2020年度投资策略报告(87页).pdf
- 10 2020年计算机行业中期策略:疫情和中美脱钩对行业意味着什么.pdf
- 1 计算机行业2025年三季报业绩综述:业绩趋势向好,关注AI+与信创主题.pdf
- 2 计算机行业从Circle和Coinbase看稳定币产业链:稳定币+RWA,迈向Finternet的关键.pdf
- 3 计算机行业“智能驾驶”系列专题报告:域控制器研究框架.pdf
- 4 计算机行业专题报告:物理AI,AI技术演进新方向,赋能产业智能化升级.pdf
- 5 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 6 计算机行业深度研究报告:字节跳动,深度布局AIGC,竞逐新一轮技术浪潮.pdf
- 7 计算机行业分析:国产算力迎来GB200时刻,AI交换网络是核心增量.pdf
- 8 计算机行业深度报告:脑机接口,从概念到落地,开启交互新时代.pdf
- 9 计算机行业深度研究:软件大革命深度,AI Agent投资宝典.pdf
- 10 计算机行业“AI+金融”系列专题研究:行业拐点已至,金融是AI应用落地的绝佳“试验田”.pdf
- 1 计算机行业:NV Rubin新架构&Agent存储最强方向,GPU Native数据库【星环科技】.pdf
- 2 计算机行业AI应用系列:3D打印百花齐放,国产厂商持续突破.pdf
- 3 计算机行业:从智谱华章MiniMax IPO看产业机遇,国内AI产业机遇期来临.pdf
- 4 计算机行业专题研究:千问APP正式接入阿里生态,流量模型AI应用产业格局有望重构.pdf
- 5 计算机行业:SpaceX如何值万亿美元?.pdf
- 6 计算机行业AI编程:重塑软件开发新范式,应用生态加速繁荣.pdf
- 7 计算机行业专题报告:GPU+ASIC渗透加速,液冷市场规模再添增量.pdf
- 8 计算机行业:AI编程商业化加速,关注本土产业参与方.pdf
- 9 计算机行业:SpaceX,从“变革”中崛起的“星际先行者”.pdf
- 10 计算机行业共享出行:迈向高质量发展,Robotaxi开启新篇章.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 1 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 2 2026年计算机行业智能驾驶专题之四:2026智驾展望,向上升阶与向下平权的双轨渗透
- 3 2026年计算机行业工业AI深度研究:跨越幻觉鸿沟,掘金万亿蓝海
- 4 2026年第10周计算机行业周报:openClaw推动AI产业进入Agent时代
- 5 2026年计算机行业多模态:视频生成,2026年有望实现从1到N
- 6 2026年计算机行业量子计算:技术突破与政策催化共振,商业化落地加速可期
- 7 2026年计算机行业量子系列报告(二):掘金量子计算,四大核心环节投资全景
- 8 2026年计算机行业星链:天基骨干筑网,手机直连拓界
- 9 2026年计算机行业月报:国产大模型token通胀,全球软件行业或迎重构
- 10 2026年计算机行业AI4S:当科技乘以科技看好——GenAI系列70暨AI4S入门篇
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
