全球AI应用迈入哪个阶段?

全球AI应用迈入哪个阶段?

最佳答案 匿名用户编辑于2025/06/17 09:42

国内 Agent 快速追赶,全球 AI 应用共同迈入商业化阶段。

1.Agent 或是 AI 应用的终极形态,目前雏形初具

Agent 可能是大模型应用落地的终极形态。我们认为,Agent 和 Chatbot 的核心智能均来 源于大语言模型,这是相同的。而 Agent 区别于 Chatbot 最大的特点,在于其能自主的、 持续的解决长序列的问题,并且能够在大模型的智力驱使下使用合适的工具。OpenAI 将 Agent 定义为 AI 系统的第三层级,后续 AI 系统还能够进行发明创新和实现组织能力。我们 认为,虽然 Agent 仅位于 AI 系统 Level 3,但是其使用工具、自动解决问题的理念,可能 是大模型应用落地的终极形态,后续大模型的能力或主要围绕 Agent 这种形式展开。

可商业化的 Agent 产品快速发展,Deep Research 功能是目前较成熟的应用方式。从目前 商业化的 Agent 产品来看,实现方式上以虚拟机为主,好处是不用占据用户的本地设备使 用权限,可以完全在云端运行,而且支持多任务并行。另一种方式是利用模型的多模态能 力对 GUI(图形用户界面)进行推理,然后进行键鼠、触屏等操作来模拟人类,好处是可 以绕开各类 App 的底层权限。功能上看,Deep Research 较为成熟,本质是让大模型不停 的搜索各种网页,然后根据用户的问题形成专业调研报告,一般会持续推理 10-30min。

Agent 能力达不到在日常工作中大规模实用的程度,根源或不在 LLM 的智能,而是在于暂 时难以将更长的动作序列串联起来。当前前沿 AI 大模型在大多数考试类问题上的表现甚至 超越人类专家,而且通过接入 API 等工具能够扩展其“动作”能力范围。但是在完成复杂、 长期的任务上,Agent 能力仍显得有限,且目前尚未有能够大规模使用的通用 Agent 应用 问世。其中的核心根源或在于 Agent 难以将更长的动作序列串联起来,来完成复杂的长期 任务。据 METR 数据(METR 选取了 2019 年至 2025 年 3 月期间能力较好的 Agent,在约 200 项任务上进行测试,主要是编码任务和一般推理任务),当模型在完成耗时少于 4 分钟 的任务时,成功率接近 100%;但对于耗时超过 4 小时的任务,成功率不到 10%,达不到 能够在日常生活工作中大规模实用的程度。

“任务长度”是 AI Agent Scaling Law 的关键衡量指标,19-24 年每 7 个月翻倍。虽然当 下 Agent 对于长任务的完成率还达不到实用程度,但是 Agent Scaling Law 提升速度很快。 据 METR 数据,2019-2024 年,AI Agent 完成任务的时长持续呈指数级增长,翻倍时间约 为 7 个月。以此趋势发展,2029 年之前,或将看到 AI Agent 能够独立完成大量目前需要 人类数天甚至数周才能完成的软件任务。这一趋势甚至还在加速,2024-2025 年 4 月 Agent 能完成的任务长度约每 4 个月翻一倍,如果以这种更快的趋势持续下去,Agent 可能在 2027 年就能完成长达一个月的任务。2025 年 5 月,Anthropic 发布了新模型 Claude 4 Opus/Sonnet,官方指出新模型可在扩展思考过程中并行调用工具,并且模型独立运行 7 小时仍保持稳定性能,记忆能力上也显著超越了所有前代模型,我们认为,模型能持续执 行的“任务长度”增速显著,Agent 的长序列瓶颈终将被突破。

2.MCP 为 Agent 开启了统一度量衡的时代

Agent 的许多功能的实现依赖外部工具调用,之前不同的模型工具调用方法不统一。大模 型无法执行诸如联网搜索、垂类数据搜索、地图导航、天气查询等能力,因此需要在推理 时调用外部的应用工具来弥补这些能力,这也是 Agent 存在的基础。问题在于,不同的大 模型提供商采用的结构和参数格式各不相同,使得对多模型集成、统一管理和标准化接入 变得复杂而繁琐。

Anthropic 提出的 MCP 为 Agent 统一了工具调用生态。Anthropic 于 24 年 11 月发布模型 上下文协议(Model Context Protocol,简称 MCP)。MCP 是一种开放标准,标准化地为大 语言模型(LLMs)提供应用场景和数据背景,使开发人员能够在数据源和人工智能工具之 间建立安全的双向连接——开发人员可以通过 MCP 服务器公开数据,也可以构建连接到这 些服务器的 AI 应用程序(MCP 客户端)。MCP 在开发者和 Anthropic 的共建下逐步得到认 可,OpenAI 和 Google 先后宣布对 MCP 的兼容和支持,国内阿里、字节、腾讯等大厂也 纷纷布局 MCP 生态。MCP 的普及为 Agent 快速构建和发展提速。

3.AI 原生应用海外商业化更好,AI Coding 是重要垂类赛道

从 Anthropic 发布的 Economic Index 看,Coding 和教育是 Claude 模型主要的应用垂 类。25 年 3 月,Anthropic 基于其 Claude 3.7 模型,统计了垂类领域的模型调用情况,发 现自 Claude 3.7 Sonnet 推出以来,Coding 以及教育、科学的使用份额有所上升。其中 Coding 在调用量中占有绝对优势,占比高达 40%左右。其他调用较多的领域包括艺术/设 计/娱乐、办公/行政支持等。

反常识的是,月活用户多的AI应用并不一定商业化好,细分垂类反而有不错的货币化效果。 据 a16z 数据,对月活跃用户数量排名前 50 的移动应用与月收入最高的应用(来自移动订 阅)进行分析,结果发现只有 40%的应用重叠。收入或使用量排名前 50 的 80 款应用中, 许多使用量较低的应用反而实现了较好的商业化。垂类的应用更有可能吸引那些愿意为其 专业价值付费的用户。

4.海外 AI 应用:25Q1 业绩大部分超预期,全年收入指引积极

关税激发更强的 AI 下游需求,美股 AI 应用 Q1 业绩大部分超预期,收入指引积极。从 Q1 业绩表现来看,大部分美股软件公司 Q1 业绩超预期,AI 成为重要增长驱动。AI 商业化进 展顺利主要在于两点:一是 AI 产品经过标杆客户验证功能已基本成熟,二是下游客户想通 过投资 AI 实现降本对冲关税风险。AI 应用提速下,SAP、ServiceNow、Palantir 等 2B 企 业Q1业绩超预期增长,尤其是对于25年全年的收入指引转向更积极态度,比如ServiceNow 在电话会中指引 FY26 AI 收入达到 10 亿美元量级,预计 AI 收入占比提升至 5-6%。

AI 产品客户渗透情况来看接近 10%,海外 AI 应用全年收入有望加速增长。我们统计了截 至 24 年年报的数据,头部 2B 软件 AI 产品在存量客户的渗透率基本接近 10%,Salesforce 的 Agent 产品由于上线较晚(24 年 9 月)渗透率偏低。目前海外 Agent 产品均采用“订阅 +用量”的混合定价模式,我们认为,在实现客户渗透的基础上,长期来看海外 AI 应用收 入有望加速释放。

5.国内 AI 应用:25Q1 利润率先改善,全年收入放量可期

国内 AI 应用加速实现从简单环节到复杂环节的产品升级。Agent 应用能力边界拓展本质在 于数据访问权限与模型能力边界的拓展,国内 AI 应用加速从简单数据环节向复杂数据环节 进阶。1)2C AI 应用:完成从通用 AI 搜索向个人知识管理的产品升级,并加速进入生活 Agent 助理场景,以 Manus 为代表的通用型 Agent 初步实现商业化;2)2B AI 应用:完成 从企业知识库到单点 Agent 的能力跨越,25 年伴随 MCP、A2A 等标准化协议推广,2B 应 用开始布局跨业务的多 Agent 协同功能,有望实现复杂场景的 Agent 交互与协同。

25Q1 AI 应用公司利润指标率先改善。我们筛选 21 家 AI 应用公司作为样本,其中 8 家企 业 25Q1 收入同比增速优于去年同期,11 家企业净利润率水平优于去年同期,利润指标改 善幅度优于收入,主要原因在于两点:1)企业 AI 内部提效效果显著,带动期间费用率下 降;2)AI 应用目前商机充分,但转化为订单、收入仍需一定周期。我们认为,部分公司 24 年已完成 AI 应用的标杆项目验证,25 年有望实现复制推广。

AI 商业化 24 年已初步验证,25 年有望加速复制推广。我们筛选泛 ERP、轻办公、AI+行 业、数据等四大类 AI 应用标的,可以看到 AI 商业化验证 24 年已初步完成,以汉得信息、 鼎捷数智、万兴科技为例,三家公司 24 年 AI 应用收入已突破千万量级。受益于 DeepSeek 带动下游客户 AI 需求,25Q1 各家公司的业务进展显著提速。

MCP 有望加速 AI 应用产业节奏,应用公司态度积极。MCP 协议旨在实现 AI 应用开发的 标准化,对于加速 AI 应用产业落地具有重要意义。海外 Anthropic、OpenAI、Microsoft、 Google,国内阿里、腾讯、百度已全面支持 MCP,AI 应用公司同样快速接入 MCP 生态。 泛 ERP 类、数据类公司支持 MCP,主要是在 PaaS 平台内提供 MCP 服务,便于企业开发 者打造更丰富的 Agent 功能;轻办公类、AI+行业类公司支持 MCP,主要作为 MCP Server 提供工具化能力。我们认为,AI 应用放量趋势日益明显,产业生态正在加速完善。

参考报告

科技行业AI展望:New Scaling,New Paradigm,New TAM.pdf

科技行业AI展望:NewScaling,NewParadigm,NewTAM。全球AI展望:NewScaling,NewParadigm,NewTAM展望全球AI发展趋势,1)模型端新架构正逐步探索,预训练ScalingLaw有望呈现新起点;2)算力端训练与推理共同推动算力需求持续上行,有望开启新TAM,同时算力硬件设计进入新范式;3)应用端商业模式变革带来新范式,Agent在细分领域率先落地带来新TAM。持续看好AI产业投资主线,看好全球AI应用进入业绩收获期。模型:预训练ScalingLaw有望开启新起点回顾近三个季度以来的大模型迭代情况,强化学习(RL)带来的后训练test-timeco...

查看详情
相关报告
我来回答