2026年第6周全球产业趋势跟踪周报(0202)OpenClaw震动开源生态,Kimi K2.5发布能力不俗
- 来源:招商证券
- 发布时间:2026/02/03
- 浏览次数:98
- 举报
全球产业趋势跟踪周报(0202)OpenClaw震动开源生态,Kimi K2.5发布能力不俗.pdf
全球产业趋势跟踪周报(0202)OpenClaw震动开源生态,KimiK2.5发布能力不俗。本周产业趋势主要集中在人工智能。人工智能方面,前Apple生态知名开发者PeterSteinberger发布了开源项目Clawdbot(后更名为OpenClaw),引起开源社区震动。此外,2026年1月下旬,北京月之暗面科技有限公司(MoonshotAI)正式发布了其最新一代大语言模型——KimiK2.5。此次发布不仅是中国人工智能领域的一个重要里程碑,更被全球业界广泛视为继DeepSeek之后的又一“颠覆性时刻”。【主题与产业趋势】OpenClaw震动开...
核心关注
市场交易热点
上周,A 股涨幅居前的重要主题指数为黄金珠宝、光模块(CPO)、光通信。

主题与产业趋势变化:OpenClaw 震动开源生态,OS Agent 时代推向台前; Moonshot AI 发布 Kimi K2.5,开源模型里的“全能高材生”
(1)OpenClaw 震动开源生态,OS Agent 时代推向台前
Clawdbot(现 OpenClaw)发布,引起生态震动
2026 年初,科技圈经历了一场静默却剧烈的震动。前 Apple 生态知名开发者 Peter Steinberger 发布了开源项目 Clawdbot(后更名为 OpenClaw)。这一项目的核心愿景简单而极具破坏力:如果 Claude 是目前最聪明的大脑, 那么 OpenClaw 就是赋予其操作计算机的“双手”。 OpenClaw 并非另一个传统的桌面 GUI 客户端,它创造性地将 WhatsApp、Telegram 等即时通讯软件异化为用户 的 “远程终端”(Remote Terminal)。用户只需在手机上发送一条自然语言指令——“检查服务器日志,若 Nginx 报错则重启”——家中的 Mac 便会自动唤醒、执行并反馈。这种“数字员工”般的体验,让该项目在短短几周内 GitHub Star 数突破 11 万,成为年度现象级开源项目。 这一数据的背后,折射出开发者群体对高权限 AI Agent 的渴望。与 Manus 等基于云端沙盒(Sandbox)的 Agent 不 同,人们不再满足于 AI 仅在虚拟环境中抓取网页或生成研报,人们渴望“放权”,让 AI 真正渗透进本地工作流, 接管那些繁琐的鼠标点击。
OpenClaw 的爆火并不只是一个“开源明星项目”的故事,它更像一个信号:行业真正的分水岭,已经从“模型更聪 明”转向“模型如何安全、稳定地动手”。而要理解这种动手能力为何难、难在何处,就必须回到 Computer Use 的 技术实现路径之争。
核心技术战场:计算机使用(Computer Use)的实现路径
让 AI 真正“接管电脑”,本质上是在争夺一套可规模化的 Computer Use(计算机使用)范式:到底是让模型像人 一样“看屏幕点按钮”,还是把“操作”尽量前移到更结构化、更可控的接口层。以 2025 年为拐点(并延续到 2026), 业界的路线选择大体可以理解为三种方向:纯视觉 GUI 代理、受控浏览器/轻视觉的网页代理、以及“接口/工具协 议优先、视觉兜底”的集成路线。不同厂商的取舍,核心都绕不开三件事:通用性、成本/延迟、以及安全与可控性。 最激进也最“科幻”的,是以 Anthropic 的 Claude 为代表的纯视觉流:通过持续截图理解界面状态,再用鼠标/键 盘动作(点击坐标、输入文本等)完成任务。这条路的最大优势是跨软件通用——几乎不依赖应用适配就能操作任意 GUI;但代价同样明确:它把“感知—推理—动作—再感知”的闭环变成高频循环,导致算力消耗、端到端延迟与调 用成本都更敏感,也更容易被页面噪声与交互细节拖慢。更关键的是,这类能力目前更常以开发者工具形态提供(例 如通过 API 的 computer use tool 以 beta 方式接入),而不是在面向大众的客户端里默认开放到“直连你的真实桌面”,这背后既有产品边界问题,也有安全与误操作风险的现实约束。也正因为“桌面级通用”带来的成本与风险 过高,许多厂商选择先把战场收敛到浏览器:在更可控的边界里,先把可用性跑通。 于是出现了以网页任务为主的“轻视觉 + 受控环境”的混合路线:把行动范围先收敛到网页与浏览器,在更可控的 沙箱里做任务闭环。OpenAI 在 2025 年初发布 Operator,其底层是 Computer-Using Agent (CUA),强调在托管 的虚拟浏览器环境中用截图理解页面并执行 GUI 动作;随后又把“研究/规划 + 动作执行”进一步收敛整合到 ChatGPT agent 与 ChatGPT Atlas 的 agent mode 里,主打“边浏览边代办”,典型场景就是订行程、预约、填 表、购物等网页任务。与此同时,Google 也在 Chrome 内推进类似能力(以 Gemini 驱动的 Auto Browse 形态出 现),同样强调对敏感操作的人工确认与权限控制。和纯视觉桌面代理相比,这条路并没有“摆脱视觉”,而是把视 觉使用限定在更窄的域内、用更强的产品护栏来换取可用性与安全性。换句话说,它更像是把纯视觉的代价与风险“装 进”浏览器沙箱里,先让闭环在高频场景落地。
但如果把视角再往前推一步:既然视觉操作的核心成本来自“看—猜—点”的反复试错,那么更省成本、也更可治理 的路径,往往不是把视觉做得更强,而是尽可能让操作变成可调用的接口。于是第三种方向更“工程化”:与其让模 型在 GUI 上反复试错,不如让软件把能力以可调用的方式暴露出来——也就是 API/工具接口优先,视觉作为兜底。 在 AI 时代之前,像 Microsoft 365 这类企业软件就长期提供自动化接口;而 Model Context Protocol (MCP) 的出 现,则把“模型 ↔ 工具/数据源”的连接进一步标准化,允许开发者用统一协议把外部系统、安全边界与调用方式 拼装进代理工作流中。基于这种趋势,所谓“终局”更可能是:高频、确定性的操作走指令集/工具调用;低频、不 可结构化的场景再交给视觉去补位。 OpenClaw 主要秉承的就是这种技术路线,这类产品更像是在把“能调用的一切”先做成可组合的技能/工具层:社区 里对各种 App 的“控制权”最终大概率不是靠模型盯着 GUI 去点来点去,而是靠一层层更稳定的接口(官方 API、 RPA/自动化连接器、以及以 MCP server 形式暴露出来的工具端点)把能力显式化、可审计化,然后让代理在这些 端点之间编排工作流。进一步说,如果这类产品真要在企业端大范围应用、成为所谓“数字员工”,形态也几乎一定 会收敛到“工具/接口驱动的代理”:把高频、确定性的业务动作沉淀成可治理的工具调用(身份认证、最小权限、 审计日志、审批/人工确认),把长尾的非结构化场景才交给 GUI/视觉去补位。也正因为这一套治理需求的存在,App 开发者会被持续“推着”暴露更稳定的接口来方便 AI 接入——因此 GUI 更像是过渡期的技术妥协;更长期来看, 行业大概率会形成某种更通用的协议与接入层,使我们熟知的软件更倾向于让大模型“按协议调用”而不是“模拟点 击”。
生态的胜利:通用协议下的积木游戏
先前我们提到 OpenClaw 主要是基于各种 App 的接口来实现操控,在这个环节中,OpenClaw 较为聪明、也较为符 合当前 AI 社区趋势的一点是,它只做了通用内核,把接入不同 App 的工作交给社区开发者,最后市面上就出现了林 林总总的关于各种工具的接入项目,这就导致了对于终端用户而言,构建自动化工作流的过程,就像是在玩一场高维 度的“拼积木”游戏——通过加载不同的功能模块,将内核与具体的 App 操控能力无缝拼接。支撑这一积木式生态的底层契约,正是 Anthropic 推出的"Skills"(技能包)。 与简单的 API 调用不同,一个成熟的 Skill 是一种“混合型智能载体”。它不仅封装了执行动作的脚本(Scripts), 更内嵌了特定场景下的动态提示词(Contextual Prompts)与操作指引(Guidelines)。简单来说,Skill 不仅仅是把 “手”交给 AI,更是把“经验”传授给 AI——它明确了在何种业务场景下调用哪个脚本,以及在遇到异常时查阅哪 份说明书。 这种架构最迷人之处在于其“递归嵌套”能力(Recursive Capability)。一个主 Skill 可以像指挥官一样,根据任务 进度动态调用子 Skill。例如,AI 在执行“财报分析”这一主 Skill 时,若遇到加密的 PDF 文件,它可以自动调取 并阅读“解密工具”的子指引,完成操作后回归主线。这种层级化的指引结构,赋予了 OpenClaw 处理极高复杂度 任务的可能。 为了引爆这一生态,Peter Steinberger 在 OpenClaw 官网构建了去中心化的 Skill Marketplace(技能市场)。这使 得全球的个人开发者不仅能上传自己编写的“技能”,还能基于他人的模块进行二次封装与迭代。这种类似 App Store 的飞轮效应,正在让 OpenClaw 迅速从一个单一工具进化为庞大的自动化操作系统。

产业趋势:OS Agent 时代推到台前
当 Agent 的能力不再停留在应用层插件或脚本工具,而是被操作系统与浏览器等基础设施逐步吸收、下沉并原生化, 整个行业的主战场就随之迁移——屏幕不再只是信息展示的面板,而成为 AI 观察与理解世界的窗口;键盘鼠标也不 再只是人类的输入工具,而变成 AI 可以调用的“肢体”。在这样的转折点上,过去以“替人点网页、跑流程”为卖 点的自动化能力迅速走向商品化,简单点击会像复制粘贴一样廉价普及,竞争壁垒从“能不能操作电脑”转向“能不 能处理长周期、非结构化、充满例外的复杂任务”,即在真实业务里持续推进、纠错、协作、收敛并交付结果。更进 一步,随着 A2A (Agent to Agent,Google 倡导的 Agent 间通信协议)等机制被更多采用,一个由机器参与的经济 网络开始浮现:个人 Agent 与商家销售 Agent 自动谈判、比价、交易,把过去需要人类在屏幕前逐步完成的决策与 执行,压缩为后台的自动协同。在这一连串变化里,像 OpenClaw 这类项目的走红,更像是一声提前的提示——用 户要的不是“会聊天的 AI”,而是“能把事办成的 AI”,而这恰恰解释了为什么 OS Agent 时代会被推到台前、并 成为 2026 之后企业讨论“数字员工”与安全治理时绕不开的新底座。
(2)Moonshot AI 发布 Kimi K2.5,开源模型里的“全能高材生”
2026 年 1 月下旬,北京月之暗面科技有限公司(Moonshot AI)正式发布了其最新一代大语言模型——Kimi K2.5 。 此次发布不仅是中国人工智能领域的一个重要里程碑,更被全球业界广泛视为继 DeepSeek 之后的又一“颠覆性时刻”。 Kimi K2.5 的问世,标志着开源模型在多模态理解、长上下文推理以及复杂的代理(Agent)协作能力上,首次对齐甚至在部分指标上超越了包括 GPT-5.2、Claude 4.5 Opus 在内的全球顶尖闭源模型。
跑分成绩优异,编程能力挑战 Claude
在 HLE(Humanity's Last Exam)这一被公认为最难"刷榜"的测试中,K2.5 以 50.2%的得分超越了 GPT-5.2 的 45.5%, 充分证明了其 Agent Swarm 架构在处理极高复杂度任务时的优越性——它不再依靠死记硬背,而是通过"规划-执行反思"的回路来解决那些需要多步推理和工具配合的难题。 在信息获取领域,K2.5 的表现更为亮眼。其 BrowseComp 网页浏览任务得分高达 74.9%,远超 Claude 4.5 Opus 的 57.8%,这主要得益于其并行搜索能力,能够同时打开多个网页进行交叉验证,有效避免了单线程模型在深层链接跳 转中丢失目标的问题。 编程能力方面则呈现出差异化的格局。在 SWE-bench Verified 测试中,K2.5 以 76.8%的得分略逊于 Claude 4.5 Opus 的 80.9%,表明在处理超大型、高度复杂的传统软件工程 Bug 修复时,Claude 凭借其代码生成的严谨性和架构把控 能力依然是当之无愧的王者。然而在 LiveCodeBench 竞技编程和前端开发领域,K2.5 凭借 Vibe Coding 的视觉理解 优势和快速迭代能力展现出更强的实用性,尤其对于需要"看图写代码"的前端工程师而言,K2.5 可能是更优的选择。
观念领先:产品结构大力拥抱 AI Agent
Kimi K2.5 并不仅仅是一个更聪明的聊天机器人,它的产品定义已经从“对话工具”转向“智能体(Agent)”。通 过四种不同的运行模式,K2.5 能够覆盖从秒级问答到长达数小时的自主调研任务的全谱系需求,从而在不同复杂度 与时效性的场景中都能提供匹配的能力与体验。 在具体形态上,K2.5 提供了四种运行模式以灵活应对不同使用场景。首先是 Instant Mode(极速模式),它以低延 迟和快速响应为核心优势,适用于日常对话、简单事实查询以及翻译等轻量任务,整体体验接近传统的 ChatGPT 式 即时问答。其次是 Thinking Mode(思考模式),在给出最终答案之前,模型会在后台进行多步逻辑推演(生成不可 见的“思维链/Chain of Thought”),因此更擅长数学解题、复杂逻辑谜题与深度语义分析等需要推理与自我纠错的 任务,并能显著提升输出准确率。第三种是 Agent Mode(代理模式),在该模式下模型被授予使用工具的权限,例 如联网搜索、代码解释器以及文件读写等;同时它能够支持约 200–300 次连续工具调用而不丢失上下文,从而缓解 传统 Agent 在长任务中容易“迷失”或“偏离目标”的问题,适合执行单一但链路较长的自动化工作,例如“分析 一篇财报并生成图表”。最后是 Agent Swarm Mode(蜂群模式・Beta),它被视为 K2.5 的核心卖点之一,代表 一种更偏“编排式智能体”的范式:模型充当“指挥官(Orchestrator)”,能够把宏大而模糊的指令拆解为数十个 子任务,并动态孵化出多达 100 个专用子智能体并行协作,以更高的吞吐与覆盖面完成复杂调研、综合分析与多线 程产出的任务。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
-
标签
- 产业趋势
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
