DeepSeekManus与AIAgent行业现状报告

来源：大数据百家讲坛
发布时间：2025/04/07
浏览次数：185
举报

相关深度报告REPORTS

DeepSeekManus与AIAgent行业现状报告.pdf

DeepSeekManus与AIAgent行业现状报告.感知：AIAgent从环境中收集信息并从中提取相关知识的能力。规划：AIAgent为了某一目标而做出决策的过程。行动：AI基于环境和规划做出的动作

1.前言：什么是 AI Agent

2023年3月AutoGPT横空出世，7月OpenAI的翁丽莲发表名为《LLM Powered Autonomous Agents》的博文，详细介绍基于LLM的AI Agent，给出了AI Agent的理想技术架构。

由复旦大学NLP团队提出的AI Agent 定义已经得到产学研等各界的认可。AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。

PPA表达式看着简单，实则包括万象：感知：视觉、听觉、嗅觉、味觉、触觉、平衡感…… 规划：目标设定、信息收集、问题分析、方案生成、决策制定、资源分配…… 行动：利用技术工具、合作与沟通、创新思维、分步执行、适应性行动…… 感知、规划与行动的每一个元素与维度，对应于智能体都是具体的应用场景，这些元素、维度与场景都可以无限的细分与挖掘。每一个元素、维度与场景的实现都会用到相应的技术、工具与资源，会催生出大量的技术、产品、解决方案与响应的企业，产业链上各个玩家均能受益。

2023年3月AutoGPT横空出世，7月OpenAI的翁丽莲发表名为《LLM Powered Autonomous Agents》的博文，详细介绍基于LLM的AI Agent，给出了AI Agent的理想技术架构。

大模型聚焦语言处理，以文本交互被动响应指令，应用于内容生成等场景；AI Agent以LLM为核心，具备多模态交互和自主执行能力，可完成跨场景复杂任务。还有很多人在问，AI Agent与大模型的区别。两者的区别，可以体现在以下几个方面：l 定义与目标：大模型（如GPT）专注语言理解与生成，通过海量数据训练掌握文本处理能力；AI Agent以LLM为“大脑”，能自主感知环境、规划任务并执行动作，实现复杂任务闭环。 l 核心能力：大模型被动响应指令，以文本交互为主；AI Agent主动执行任务，具备多模态交互（语音/图像）、动态学习和工具调用能力（如API操作）。l 应用场景：大模型用于内容生成、客服问答；AI Agent应用于供应链优化（阿里仓储Agent）、医疗分诊（腾讯车载系统）、实时决策（自动购物）等跨场景任务。 l 技术实现：大模型依赖Transformer架构与高算力；AI Agent需叠加规划、记忆模块及工具接口，形成“感知-决策-行动”闭环。l 局限性：大模型无法自主执行跨场景任务；AI Agent需解决工具可靠性（API兼容性）和动态环境适应（任务中断处理）等工程难题。

2.DeepSeek 等推理模型对 AI Agent的影响

前面简单介绍最近两年AI Agent发展的基本路径。其实所有问题的原点，最终还要回到大模型上。 LLM Based Agent的能力与功能取决于LLM的性能，如果大模型能力足够强大，智能体也就能做到胜任更多业务场景。当然大模型足够强大了，可能也就不需要智能体了，这个涉及到了模型即应用，后面会讲。所以像DeepSeek R1、通义千问 QwQ-32B、文心一言 X1、混元 T1这样的高质推理模型的出现，对AI Agent性能与功能的提升有着很大的赋能，这里总结了几点。

技术方面：DeepSeek 让AI Agent的推理与决策能力提升，规划与执行能力增强，工具调用能力提升，自动化与拟人化交互能力升级，多模态与个性化能力拓展，结合多模态模型， DeepSeek 可以推动AI Agent实现更自然的“五感”交互，也为具身智能的发展奠定基础。 • 设计模式：AI Agent有四种主流模式，反思、工具使用、规划和多智能体协作，毫无疑问推理模型可以大幅提升AI Agent的反思能力和规划能力，能通过思考推理调用或者创造更合适的工具，也能更合理地定义智能体职能角色并为它们分配更合适的任务，这样智能体的执行能力会大大加强。 • 应用方面：DeepSeek支持本地化部署，可以让使AI Agent在离线环境下仍能运行，保障数据隐私。并且基于deepseek等推理模型的AI Agent可以打破标准化边界，不仅适用于标准化场景， DeepSeek的高阶思维能力推动它向战略决策、复杂业务流程优化等非标领域延伸。

开发和部署：DeepSeek采用开源技术路线，降低了企业训练和调优成本，使中小开发者能够以更低的成本专注AI Agent开发，以加速AI Agent的多样化创新，提升市场竞争力。再就是算力和成本优化方面，通过算法创新（如思维链技术）和训推范式革新，DeepSeek在保持性能的同时显著降低算力消耗，为大规模Agent部署提供经济可行性。 • 用户体验：DeepSeek等推理大模型可以让AI Agent与用户进行更自然、更智能的对话。比如在客户服务场景中，AI代理可以使用 DeepSeek的模型更好地理解复杂查询并提供准确回应，从而提升用户体验。 • 产业生态：AI Agent作为上层应用，有了deepseek等大模型的加持，会形成以推理大模型为核心的分层技术生态，推动跨行业协作与标准化。并且企业能够通过快速接入DeepSeek快速实现数据价值挖掘。 • 市场格局：DeepSeek的技术突破推动中国从AI规则接受者转变为标准共治者，其开源策略和国产化优势可能重塑全球AI Agent市场的竞争与合作模式。

3.Manus通用智能体带来的行业启示

Manus技术架构通过工具链整合优化而非底层模型创新，实现了从任务理解到结果交付的全链路自主执行，同时兼顾效率与成本优势。 • 从官方视频展示来看，Manus可以用于零售与电商、金融、教育与研究等领域的多种应用场景。我在书里介绍了智能体在多个领域的应用，在技术部分提到了相关技术架构，在智能体技术发展趋势和应用发展趋势方面也有介绍多智能体，可以帮助读者理解这种智能体。 • Manus在工程化方面下了很大功夫，率先产品化了，能够一步到位给与用户想要的直接结果。可以给到普通用户更多智能体应用的感知和更好的体验，这是目前依托那些智能体平台构建的智能体尚未实现的，也是需要努力方向。

Manus技术架构通过工具链整合优化而非底层模型创新，虽然大家对它的评价褒贬不一，但作为通用智能体还是为行业带来了不少的启示。产业协作革新：多智能体协同架构突破单一AI局限，模拟人类团队分工，推动金融、医疗等场景全流程自动化升级；分布式资源调度降低推理成本，支持实时决策。技术创新转型：优先工程化整合，未自研底层模型；支持动态训练与崩溃恢复，为AI优化提供新方法。开源生态协同：技术壁垒转向工具链整合，开源加速通用智能体在多领域渗透。一些典型的项目，比如Openmanus、OWL、 AutoMate等都表现出了很强的发展潜力。伦理与治理挑战：数据隐私保护升级，就业结构深度调整，要求教育体系适配新技能需求。

Manus的出圈也证明了能够自主执行相对复杂任务的智能体在现阶段是可行的，虽然需要耗费很多的token和时间。接下来肯定会有更多同类产品出现，也会进行更多优化与迭代。加上大语言模型快速发展，今年内这类智能体体验应该能有很大提升。

4.AI Agent行业现状

产品现状：从企业级角度来其产品形态可以分为通用型、垂直领域专家型、企业级解决方案三个类别

通用型Agent：以实在Agent为代表的基于自动化技术的企业级通用智能体，代表了当前的企业应用生产力。以Manus为代表采用大模型（推理模型+多模态模型）+API模式通过屏幕截图来识别屏幕元素，以API接口调用各种工具执行任务的computer use 智能体。

垂直领域专家型Agent：金融领域：摩根大通等机构部署的智能投顾系统，通过强化学习优化交易策略，错误率降低90%。医疗领域：创业慧康APTS系统实现患者全流程管理，早诊早治率提升42%，同时支持影像识别与分诊报告生成一体化。零售领域：动态定价与AR购物助手推动用户转化率提升40%，库存成本降低 30%36。

企业级解决方案：低代码开发平台：钉钉AI助理覆盖70万家企业，支持通过自然语言生成自动化流程，开发周期缩短至3-5天。私有化部署：京东云、微软等头部企业提供定制化智能体服务，京东云智能体数量超7000个，微软企业客户达10万家。

AI Agent的产品及服务形态，主要有以下几种。内容生成助手：利用LLM生成能力，根据用户需求生成文章、视频、音乐、代码等内容。知识助手：通过LLM的检索增强生成方案，结合私有知识库，提供基于自然语言的对话式企业私有知识访问。案例：LangChain-Chatchat（RAG应用构建平台）和 FastGPT（商业运营SaaS应用）。数据分析助手：利用LLM的自然语言转数据分析能力，进行数据获取、分析和可视化。案例：DB-GPT（多场景交互数据分析项目）、OpenAgents-Data Agent（本地结构化数据文档分析项目）。工具使用助手：根据用户需求智能使用API、数据库、互联网平台等工具。案例： LangChain-Agent（Agent组件）和OpenAI-Assistants API（构建AI助手的API）。 Web操作助手：利用LLM的自动化网络浏览、操作与探索能力，简化Web浏览访问与操作。案例：perplexity、秘塔等AI搜索引擎以及Agent构建平台上的AI Agent应用工作流助手：结合上述基础Agent能力，自主规划与分解任务，设计任务步骤，并智能使用各种工具完成任务。案例：OpenAI-Codex（代码生成助手）和OpenAI Playground （AI助手构建平台）。这部分详细内容，在图书12章商业模式部分可以看到。

5.AI Agent如何影响企业经营

企业经营以优化流程、管理资源实现盈利与客户增长为目标。AI Agent可以系通过降本增效、风险管控与组织革新，成为企业竞争力升级的关键引擎，主要通过三个维度影响企业经营：

业务运营：自动化标准流程（如财务、供应链），提升效率 40%-60%，降低错误率；处理海量数据辅助实时决策，结合多模态技术优化客户体验（如24小时智能客服、个性化推荐），驱动数字化转型。 • 战略决策：提供精准市场洞察与风险评估，动态调整策略（如贷款谈判、库存优化），支持数据驱动的科学决策。 • 组织管理：重构岗位分工，推动人机协作（员工监督AI执行），强化HR与IT协同，优化培训体系；重塑组织文化，未来以AI为核心构建敏捷团队，要求员工聚焦复杂决策与创新。

企业应用AI Agent主要有三种模式：直接使用、客户端调用API和本地私有化部署。直接使用适合对数据隐私要求不高、希望快速接入AI能力的企业，尤其是中小型企业，可直接利用市场上现有的AI Agent服务，如实在Agent、Operator、Manus等，或在Coze等平台构建个性化 AI Agent。 • 客户端调用API适用于需将AI能力集成到现有系统的企业，通过调用第三方API接口，结合客户端工具如AnythingLLM、Cherry Studio等，开发智能客服、文档处理助手等应用。 • 本地私有化部署适合对数据安全和隐私要求高的大型企业，可在本地环境中部署AI Agent，使用开源框架或自研技术构建技术闭环，如借助LangChain、OmniParserV2等开源项目进行部署。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）