计算机领域,AI Agent 以 ERP/OA 等管理软件为载体,结合企业私有数据实现 任务自动化与智能决策。
1、企业管理及办公 Agent:助力企业经营降本增效
B 端通用场景中管理类软件是 AI 的最佳入口,Agent 为应用呈现的理想形式。 企业若想利用AI提升经营效率,管理类软件为无法绕过的AI载体。依托于ERP、 OA 等管理软件,基于企业目前积累的特有知识,可实现 AI 辅助决策分析,实现 任务自动化。Gartner 预测,到 2028 年,至少 15%的日常工作决策将通过人工 智能代理自主完成(这一比例在 2024 年尚为 0%)。 从海外进展来看,随着生成式 AI 和推理技术的快速发展,AI Agent 在 B 端企业 服务场景中的应用潜力正在加速释放。通过与企业积累的大量运营数据深度结合,AI Agent 能够基于角色定位和目标导向,实现一定程度的自主操作,有效承担企 业内重复性和低附加值的工作。这不仅帮助企业简化流程、提升效率,还通过减 少人工投入和优化资源配置,显著降低运营成本,为企业提供了智能化转型的新 路径。 以 Salesforce 的 Agentforce 为例,其为一个典型的应用侧代理平台。它允许 企业在 Salesforce 平台上构建和部署自主 AI 代理,这些代理能够自动执行各种 业务功能,如销售、服务、营销和商务等。同时公司于 24 年 12 月发布 Agentforce 2.0,上线新的预构建代理技能库将 Agent 扩展到 CRM、Slack、Tableau 和 AppExchange 的合作伙伴应用中,同时 Agent Builder 能够解释自然语言指令(例 如“加入新产品经理”)以自动生成新代理,进一步提高代理构建的便利性和灵活 性。Agentforce 的主要特点包括: 自主操作:代理可以独立分析数据、做出决策并完成任务,如解决客户问题、 筛选销售线索和优化营销活动。 深度集成:作为 Salesforce 平台的一部分,Agentforce 代理能够无缝访问 和交互各种 Salesforce 应用中的数据,利用客户信息、触发工作流程和更 新记录。 可定制性:用户可以使用低代码或无代码工具,快速构建和定制代理,以满 足特定的业务需求。 安全性和信任:Agentforce 通过 Einstein Trust Layer,确保代理在使用任何大型 语言模型时,Salesforce 数据不会被第三方模型提供商查看或保留。
国内 ERP 等企业也实现 AI 模块持续落地。2 月 6 日,用友 BIP 全面上线以 DeepSeek-V3 和 DeepSeek-R1 作为基座大模型的智能服务,企业客户可以通 过用友 BIP3 R6 智能平台的公有云、专属云模式使用相关服务。AI 层面,用友 已有多个 AI 模块落地,用友 AI 在商旅费控、人力招聘均已有落地销售,未来还 会持续推出更多模块,空间广阔。金蝶同样宣布已将 DeepSeek 全面集成至金蝶 云全线 SaaS 应用及金蝶云苍穹平台,为客户提供更高效、更安全、更低成本的 智能解决方案,推出包括星空 BOSS 助理、AI 记账、智能生成财务报告、智能 销售助手、AI 生成看板等场景应用,赋能企业生产经营。
2、编程类 Agent:提效利器,已呈现大规模应用
(1)Coding Agent 呈现出爆发式增长态势。Coding 天然为最贴近 AI 的重要应用,近年来呈现出爆发式增长态势。2023 年 AI 代码工具市场规模价值为 48 亿美元,估计在 2024 至 2032 年之间 CAGR 超 23.2%。
国外内市场空间广阔,AI Agent+编程发展迅猛。根据《2024 年中国 AI 代码生 成市场观测报告》,2023 年中国 AI 代码生成市场规模已达到 65 亿元,预计到 2028 年将增长至 330 亿元,年复合增长率高达 38%。2025 年 2 月 4 日,在三 方基准测试平台 ChatbotArena 公布的最新的大模型盲测榜单中,阿里云通义千 问旗舰版模型 Qwen2.5-Max 在数学和编程等单项能力上排名第一。
(2)Coding Agent 已逐步进军软件开发全生命周期。AI 编程工具的应用场景将从传统的代码编写扩展到软件开发全生命周期。2025 年,AI 编程工具正在重塑开发流程。无论是日常编码、UI 设计,还是全栈开发 和快速验证创意,开发者都可以根据需求选择最适合的工具。随着 Trae 等新工 具的加入,企业级 AI 编程助手的发展也日趋成熟,为团队开发带来更多可能性。 IDC 预测,到 2027 年,55%的利用 Gen AI 功能的新应用程序将由低代码或无 代码开发人员技术开发。2029 年,基于 GenAI 的软件测试工具能够编写 80%的 测试。随着技术的成熟和应用场景的拓展,AI 编程工具将成为软件开发领域的标 准配置,彻底改变软件开发的方式和效率。
(3)AI Agent+编程实例。微软:GitHub Copilot 引领 AI 编程革命。微软通过 GitHub Copilot 在 AI 编程 领域取得了显著的领先地位。作为全球首个大规模商用的 AI 编程助手,GitHub Copilot 自 2023 年以来持续进化,已成为开发者工作流程中不可或缺的一部分。 GitHub Copilot 基于 OpenAI 的 Codex 模型开发,该模型是在 GPT 的基础上针 对代码理解和生成进行了专门训练。2023 年底,GitHub Copilot 升级到了基于 GPT-4 的新版本,代码生成能力得到显著提升。2024 年,微软进一步扩展了 GitHub Copilot 的功能范围,推出了 Copilot Enterprise 版本,增加了以下关键功 能: Copilot Chat:支持自然语言对话,开发者可以用自然语言询问编程问题, 获取代码解释、调试建议等。 Copilot Workspace:基于自然语言描述自动生成完整应用程序,包括前端界面、后端逻辑和数据库设计。 企业知识库集成:能够学习企业内部代码库和文档,提供符合企业编码规范 和架构的建议。 GitHub Copilot 商业价值已得广泛验证。根据微软 2024 年 5 月更新的《研究: 量化 GitHub Copilot 对开发者生产力和幸福度的影响》,使用 GitHub Copilot 的开发者完成同样任务的时间比不使用的开发者平均减少 55%,特别是在编写重 复性代码、处理不熟悉的 API 和框架时,效率提升更为显著。在商业价值方面, GitHub Copilot 已经成为微软增长最快的开发者工具之一。在 2024 年 7 月的微 软财报电话会议中,GitHub Copilot 的年度经常性收入(ARR)已突破 3 亿美元, 占 GitHub 当年整体增长的 40%,成为推动其业务发展的重要动力之一。
谷歌:Gemini Code Assist 全面赋能初级开发者。2025 年 2 月,谷歌正式宣布 Gemini Code Assist 进入公测阶段,向所有开发者免费开放其核心编码功能。 Gemini Code Assist 基于谷歌的 Gemini 2.0 模型,能够生成完整的代码块,并 在编写过程中自动完成代码,还可提供全方位的编程协助。开发者可通过自然语 言向 Gemini Code Assist 发出指令,例如要求构建包含特定字段的 HTML 表 单。
亚马逊:CodeWhisperer 赋能云原生开发。亚马逊在 2023 年正式发布了 AI 编 程助手 Amazon CodeWhisperer,并在 2024 年进行了全面升级,为 AWS 生态系统中的开发者提供 AI 编程支持。据亚马逊内部测试,使用 CodeWhisperer 的 参与者成功完成任务的可能性要高 27%,而且完成速度平均加快了 57%。据 InfoQ 对 CodeWhisperer 的全方位深度测评,支持 Python,Java,JavaScript 等 15 种编程语言以及 VS Code,IntelliJ IDEA,Amazon Cloud9、Amazon Lambda 控制台、JupyterLab 和 Amazon SageMaker Studio 等多种集成开发环境,利 用它编写的代码能够很快地写出健壮,优雅,具有很高扩展性的代码。
百度:文心一言赋能 AI 编程。百度作为国内 AI 领域的领军企业,基于文心一言 大模型推出了面向开发者的 AI 编程工具——文心·快码(Comate)。文心·快 码是基于文心大模型 4.0 开发的 AI 编程助手,于 2023 年底推出,并在 2024 年 进行了全面升级,针对中文开发者习惯和需求进行了专门优化,支持中文需求描 述直接生成代码,支持代码、文档、截图等多模态输入,能够理解复杂的开发场 景,覆盖需求分析、架构设计、代码生成、测试用例生成等全链路开发流程。 2024 年 6 月,百度升级了文心·快码,增加了以下功能:代码解释与教学:能够详细解释代码逻辑和原理,帮助开发者学习新技术。 智能调试:能够分析错误信息,提供调试建议和修复方案。 国产化适配:针对国产操作系统和数据库进行了专门优化,支持信创环境下 的开发。
阿里巴巴:通义灵码重塑开发体验。阿里巴巴基于通义大模型推出了 AI 编程助 手通义灵码,为开发者提供全面的 AI 编程支持。通义灵码是基于通义千问大模 型开发的 AI 编程工具。2025 年 3 月,通义灵码迎来了一次重要更新,正式推出 了全新的模型选择功能,除了继续支持 DeepSeek 满血版 V3 和 R1 外,还引入 了备受瞩目的 Qwen2.5-Max 模型。其编程能力、速度和准确率均得到了显著提 升。在 Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond 及 MMLU-Pro 等主流基准测试中,Qwen2.5-Max 的表现与 Claude-3.5-Sonnet 不相上下,甚 至全面超越了 GPT-4o、DeepSeek-V3 以及 Llama-3.1-405B 等模型。
字节跳动:MarsCode 一站式开发。豆包 MarsCode 是由字节跳动推出的 AI 驱 动的一站式开发平台,深度融合代码生成、云端开发环境、AI 辅助编程等功能, 旨在革新传统编程模式,提升开发效率与协作体验。其核心理念是通过智能化工 具降低开发门槛,同时覆盖从编码到部署的全流程需求。 AI IDE Trae 提升开发效率。Trae 支持原生中文,集成了 Claude 3.7 和 GPT-4o 等主流 Al 模型(国内版为豆包大模型和 DeepSeek 模型)完全免费使用。Trae 的 主要功能包括 Builder 模式和 Chat 模式,其中 Builder 模式可帮助开发者从 零开始构建项目,Chat 模式支持对代码库或编程问题进行提问和优化。Trae 具 备友好的交互设计,如代码预览、Webview 功能,以及强大的代码生成能力。
ServiceNow:作为全球领先的 IT 服务管理平台提供商,积极布局 AI 编程领域。 ServiceNow 的 AI 编程解决方案主要包括 Now Assist for Code 和 App Engine Studio with Now Assist 两大产品线,能够根据注释或自然语言描述生成 ServiceNow 平台专用的 JavaScript 代码,支持服务器端脚本和客户端脚本。App Engine Studio with Now Assist 是 ServiceNow 在 2024 年初升级的低代码开发 平台,集成了 AI 能力,业务用户可以使用自然语言描述需求,AI 自动将其转换 为可执行的应用程序,自动生成工作流程和业务规则,并且能无缝切换代码视图 和可视化设计视图。
卓易信息:AI 赋能软件开发。卓易信息专注于“自主、安全、可控”的云计算 产业链业务,为 CPU 和计算设备厂商提供云计算设备核心固件(BIOS、BMC) 产品和服务,同时为政企客户提供端到端的云服务解决方案。公司全资子公司开 发的低代码 IDE 工具 SnapDevelop 目前已支持 AI 辅助业务开发,可通过自然语 言生成代码、添加注释,并提供优化建议,显著提升了业务逻辑的编码效率。
普元信息:EOS 平台融合 AI 编程能力。普元信息作为国内领先的软件基础平台 提供商,在 2003 年发布了国内首款专业低代码平台产品 EOS,并面向各行业头 部客户的信息化建设需求,持续以低代码技术的方式,升级应用开发、数据治理、 应用支撑与集成能力,累计帮助超过 5000 家大型企业,建设超过 10 万款企业 应用,累积了面向企业级应用开发的海量业务对象和数据指标,基于大模型接入 以及微调训练,最终构建成为普元专有模型能力。
3、电商全链路受益 Agent,重塑用户购物体验
个性化商品推荐。AI Agent 通过分析用户的浏览历史、购买行为和偏好,能够实 时生成个性化的商品推荐。例如,值得买科技的“小值”Agent 能够通过对话深度 理解用户需求,基于全网实时消费经验、价格信息进行快速总结,提供口碑总结、 商品对比、商品推荐、全网比价等服务,为存在不同决策难点的消费者提供个性 化的建议,从而提升消费决策的质量和效率。这种个性化推荐不仅提高了用户的 购物转化率,还增强了用户对平台的粘性。 充当智能购物助手,重塑购物体验。AI Agent 可以作为智能购物助手,帮助用户 完成复杂的购物任务。例如,京东的智能客服 Agent 通过自然语言处理技术,能 够理解用户问题并提供精准回答,甚至可以协助用户完成订单下单。此外,阿里 云推出的主动式智能导购 AI 助手能够主动询问用户需求并提供精准推荐,极大 地提升了购物体验。
AI Agent 整合航班信息、酒店预订和行程规划,为用户提供一站式的旅行服务。 AI Agent 在旅行预订领域的应用逐渐成熟,极大简化了旅行规划的复杂性。携程 推出的 TripGenie 旅行助手利用大型语言模型技术,涵盖旅行的各个方面,从详 细的行程制定到旅行产品的预订。它可以无缝响应文字和语音命令,通过图文结 合、卡片、链接来提升用户体验,并引导用户快速找到相关的结果,从而提升效 率。基于 LangGraph 构建的 AI Travel Agent 也展现出强大的功能。它能够处 理航班查询、酒店预订以及个性化邮件发送等任务,支持多语言交互。用户可以 通过简单的语音指令或文本输入,获取从出发地到目的地的完整旅行计划,包括 交通、住宿和活动安排。这种智能化的旅行规划服务不仅为用户提供了便利,还 为企业带来了更高的运营效率和客户满意度。
AI Agent 在点评生成和内容创作方面同样展现出巨大的潜力。通过自然语言处 理和机器学习技术,AI Agent 能够根据用户的消费体验和反馈,自动生成高质量 的点评文案。大众点评推出的“点仔”具有 AI 帮写功能,需要撰写点评或笔记 时,“点仔”的 A!帮写功能可以提供写作灵感和建议,提升内容的质量和效率。
(1)Agent 实现自动化内容生成,成为创意辅助工具。AI Agent 从技术概念转化为生产力工具,将实现多领域内容自动化生成。AI Agent 正经历从技术概念向生产力工具的范式跃迁,其核心价值在于通过深度学 习框架与自然语言处理技术的深度融合,构建起端到端的自动化内容生成体系。 当前技术突破已实现多模态信息的动态整合能力,例如 OpenAI 的 GPT-4o 模型 可同步处理文本、图像及语音输入,结合检索增强生成(RAG)技术,Agent 能够根据预设的主题、风格和受众需求,高效生成新闻报道、视频脚本、广告文 案等多种形式的内容。这一技术的突破不仅提升了内容创作的效率,更通过精准 匹配和个性化生成,满足了不同场景下的多样化需求,为内容生成行业带来了革 命性的变化,有望重塑内容创作的生态格局。以下是不同场景下的 Agent 内容生 成举例:
①新闻媒体:利用 Agent 实时生成新闻报道,尤其是突发新闻和数据新闻。 ②影视制作公司:通过 Agent 生成剧本初稿和分镜头脚本,提升创作效率。 ③广告公司:利用 Agent 生成创意广告文案和视觉素材。
商业化落地已现显著成效。捷成股份的 ChatPV 引擎已经展示了 AI 在视频内容 生成中的强大能力,1 月 6 日,捷成股份 AI 智能视频创作引擎 ChatPV“文生视 频”功能正式上线,可根据用户文字描述,智能生成对应动态画面的高质量视频 素材。公司于 2 月 14 日宣布,其 AI 智能创作引擎 ChatPV 与 DeepSeek 模型已 经完成深度对接,这一合作将为视频内容理解、情节推理、剧本生成等多个核心 环节注入全新活力。
值得买科技自主研发的"值得买消费大模型"作为消费领域的垂直大模型,通过多 模态融合与动态数据迭代构建起智能内容生成体系。该模型基于 130 亿参数基座, 历经 300G 消费领域专业语料训练及 1.2 亿次迭代优化,融合 RAG(检索增强 生成)技术实现实时商品价格、用户评价等动态数据的即时调用,可精准生成适 配不同场景的营销内容。 技术架构上,模型依托 10 亿级商品库与百亿级消费内容库,结合 AIUC(理解)、 AIGC(创作)、AGENT(执行)三大引擎,实现从数据洞察到创意输出的全链路自动化。在广告营销场景中,已实现单条商品描述的生成时效从人工 4 小时压 缩至 30 秒,且支持 20 种风格模板的一键切换。
顺网科技的“顺网灵悉引擎”是一款自主研发的智能体引擎,具有多模态、融合大 小混合模型、自主规划等特点,能够实现 AI 应用与大模型解耦,从而降低 AI 应 用的开发门槛。该引擎通过四个核心系统——智识中枢、感知与反馈、执行体系 和陪伴设定——实现了从大模型到实际应用的有效转化。
AI Agent 作为创意辅助工具,帮助创作者优化创意。Agent 可以为创作者提供 灵感启发、创意方向和优化建议。这种能力的核心在于其对海量数据的处理和深 度学习能力,使其能够识别出成功的创意模式,并结合市场趋势和受众偏好,为 创作者提供精准的指导。此外,AI Agent 的记忆功能使其能够记住用户的偏好和 历史交互信息,从而构建更加精准的用户画像,进一步提升创意辅助的个性化和 精准度。不同场景下 AI Agent 作为创意辅助工具的应用: ①剧本创作:Agent 可以分析市场趋势和观众喜好,为编剧提供情节建议和角色 设定优化方案。 ②广告创意:Agent 可以分析不同广告的效果数据,为创意人员提供更有效的创 意方向。
1 月 20 日,芒果超媒在互动平台向投资者透露,他们最新推出的 AI Agent 平台 ——“芒果西米露”已正式上线。“芒果西米露”平台的推出,旨在搭建超过 70 个智 能体,覆盖内容创作的多个方面。该平台基于 AI Agent 技术,利用大语言模型 和多模态技术,结合芒果超媒在广电行业积累的大量数据和经验,实现智能化的 内容生成与审核。此外,平台还依托芒果大模型,支持节目创意策划、角色拟人 对话、生成式内容推荐等应用。
(2)Agent 实现个性化内容推荐和智能审核管理。精准触达用户需求提高粘性,动态优化推荐策略。AI Agent 在内容分发平台中通 过分析用户行为数据和内容特征,实现个性化的内容推荐;基于用户的历史行为、 兴趣偏好、社交关系等多维度数据构建精准的用户画像,并结合深度学习、协同 过滤等算法,实时学习并预测用户需求,从而精准推荐符合用户兴趣的内容。 这种个性化推荐不仅提升了用户体验,使用户能够更高效地获取感兴趣的内容, 还通过精准触达用户需求,增加了用户在平台上的停留时间,进而提升了用户粘 性。此外,Agent 的动态学习能力使其能够根据用户的实时反馈不断优化推荐策 略,进一步提高推荐的准确性和多样性。

从平台运营角度来看,AI Agent 的应用能够有效提升平台流量和运营效率。通 过精准推荐,平台能够更好地引导用户行为,优化资源配置,减少无效内容的推 送,从而实现更高的用户活跃度和转化率。随着技术的不断进步,Agent 在内容 分发平台中的作用将愈发重要,推动内容消费与创作生态的持续革新。 值得买依托自有电商分发平台积累海量消费数据,打造 Agent“小值”为用户精 准推荐个性化内容。值得买科技覆盖全网跨平台 10 亿+商品信息与全网近 120 亿内容信息,依托海量的高质量数据库,公司已经在其平台上应用了“小值”Agent, 通过分析用户的购买行为和浏览历史,为用户推荐个性化的商品和内容,显著提 升了用户体验和平台的流量。
天娱数科依托智能推荐算法,旗下移动应用分发平台能支持各类应用部署,助力 开发者触达用户。凭借海量数据与人工智能算法技术,天娱数科自研天星基座大 模型,并开发了 AI 营销 SaaS 平台。该平台集成 AIGC 广告素材生成、智能推 广投放、AI 直播电商运营三大模块,提供全链路 AI 营销服务,推动 AI 营销从 1.0 降本、2.0 提质逐步迈入 3.0 扩量阶段。在市场存量竞争的环境下,企业面临 降本提质的挑战,该平台基于海量数据实现 AI“效果预测”,智能管理广告投放任 务,批量搭建并自动执行投放计划,解决企业在策略洞察、精准投放、效果反馈 与优化等方面的难题。
AI Agent 在内容分发平台的内容审核和管理中将发挥至关重要的作用。通过自 然语言处理(NLP)和图像识别技术,Agent 能够高效地自动检测和过滤违规内 容,确保平台内容的合规性和安全性。文本内容审核方面,Agent 利用自然语言 处理技术对文本进行分词、句法分析和语义理解,能够精准识别出可能含有敏感 信息的词汇或短语,有效拦截违规内容。图像内容审核方面,Agent 通过图像预 处理、特征提取和内容识别等技术,能够自动检测图像中的违规元素,如暴力、 色情或不当广告等内容。此外,Agent 能够根据用户反馈和实时数据不断优化审 核策略,进一步提高内容审核的准确性和多样性。这种方式不仅提升了用户体验, 使用户免受不良信息的干扰,还增强了平台的公信力和法律合规性。
(3)Agent 实现广告智能化生成与投放。AI Agent 逐渐成为广告营销领域提升营销效果和效率的关键工具。通过自动化 生成广告内容和优化广告投放策略,AI Agent 能够显著改善广告营销的各个环节。 (1)AI Agent 能够实现广告内容的自动化生成。借助自然语言处理(NLP)和 生成对抗网络(GAN)等技术,AI Agent 可以根据用户的行为数据、兴趣爱好和 历史购买记录,自动生成高质量的广告文案和视觉内容。例如,AI 可以为不同受 众群体调整广告的语气和风格,使其更符合目标受众的偏好,从而提高广告的吸 引力和转化率。 (2)广告投放策略优化方面,AI Agent 能够动态调整广告投放策略。它可以通 过实时数据分析和机器学习算法,监测广告的点击率、转化率和用户反馈等关键 指标,并根据这些数据自动优化投放策略。例如,AI Agent 可以根据不同渠道的 表现自动调整预算分配,确保广告投放的效率和投资回报率最大化。 (3)AI Agent 具备多渠道整合的能力。Agent 能够跨社交媒体、电子邮件、移 动应用等多个渠道进行广告投放和管理,这种跨渠道的优化能力使得广告主能够 更全面地覆盖目标受众,并根据用户在不同渠道的行为习惯制定更精准的营销策 略。
引力传媒于 2023 年推出了自有营销电商行业模型,并推出了三大 Agent——感 知智能体、决策智能体和内容智能体。公司还推出了“创意助手”“视频助手”和“通 用助手”三大 AIGC 产品应用,用于赋能内容、电商和策略等多业务团队的工作 执行与内容产出效率。2025 年,公司将进一步加大 AI 技术研发的投入与能力应 用,探索 AI 赋能的增值商业化服务能力,搭建 RAG(检索式生成增强)数据库, 借助 AI-Agent 深度理解业务知识,串联业务工作流;健全内部 AI 系统的内容、 人群、达人标签体系,为客户提供整合营销、策略制定、用户洞察、投放诊断等 AI 应用集成工具;重点推进 AI 数字员工的建设,通过深度结合行业知识与 AI 技术,打造可自主执行复杂任务、实时响应需求的虚拟员工团队。
4、AI Agent +眼镜:出货量快速增长,处于行业爆发期
(1)Meta:联动 Rayman 和社交平台,兼备科技与时尚属性。RayBan Meta 自推出以来售出 200 万副,市场表现强劲。RayBan 与 Meta 合 作发布第二代智能眼镜RayBan Meta,将时尚设计与AI大模型的智能技术相结合, 与 Instagram 等社交平台实现联动,引起了业内外广泛的关注。产品使用方法简 单,只需要一句“嘿 meta”的语音指令,便可实现接打电话、发送消息、录制 视频、Live AI、实时翻译等功能。RayBan Meta 定价 299 美金。
(2)雷鸟:搭载阿里大模型,拍摄、互动功能亮眼。雷鸟科技成立于 2017 年,由 TCL 电子孵化,并获腾讯、南方电视新媒体等战略 投资,是全球领先的场景互联网及 AI×IoT 服务平台。2021 年 10 月 15 日,雷 鸟科技正式进军智能眼镜市场,与 TCL 电子共同孵化的 AR 新锐公司雷鸟创新。 雷鸟阿里深度合作,打造首个面向智能眼镜的 AI 大模型。雷鸟创新与阿里云在 AI 眼镜领域达成深度战略合作,雷鸟创新的 AI 眼镜接入通义系列大模型。在此 基础上,雷鸟创新与阿里共同打造了业内首个专门面向智能眼镜的 AI 大模型。 其为 Agent 提供更精准的知识支持和决策依据,从根本上提升了 AI 眼镜的交互 体验。佩戴上雷鸟 V3 后,只需长按镜腿触控板或者说出“小雷小雷”、"Hey, ReyNeo" 就可以唤醒 AI 助手,开启 AI 体验。除了简单的语音问答,雷鸟 V3 还可以借助摄像头识别前方的物品,借此实现视觉 AI。
雷鸟 V3 对标 RayBan Meta,成为国内首个大模型厂商针对眼镜形态产品开展 深度定制的产品。2025 年 1 月 7 日的 CES 期间,雷鸟创新举行了名为“Meta, Beyond”的发布会,布了雷鸟 V3 AI 拍照眼镜,雷鸟 V3 AI 拍摄眼镜是一款集成 了出色画质相机、快速准确 AI、高音质耳机、舒适佩戴眼镜于一体的新产品,标 准款定价 1799 元。雷鸟 V3 的 AI 平均响应速度为 1.3s,远超 Ray-Ban Meta 及其他接入通用模型的 AI 眼镜;V3 的 AI 识别准确率高达 98%,可称为用户真正全能的百科助手。在场景方面,双方还将探索更多的多模态场景,让 AI 眼镜 不仅聪明,也更加实用、有趣。
(3)Rokid Glasses:携手宝龙兼具时尚特点,应用场景广泛。24 年 11 月 Rokid 发布 Rokid Glasses,售价 2499 元。Rokid Glasses 是 Rokid 和头部眼镜品牌暴龙深度合作的产物,双方均参与定义、设计、营销和定价。在 符合大众审美、眼镜使用基本需求的前提下,结合视觉与听觉,实现了 AR、AI 等丰富功能,可以在 AI 问答、购物、办公、娱乐等从场景中发挥深度作用。Rokid Glasses 将主板、电池等核心组件集成于框架之中,使得外观看上去更像一款普 通框架眼镜。重量为 49g,轻便型整体较好。AI 功能方面,在整合阿里巴巴旗下 通义千问大模型后,Rokid Glasses 将具备物体识别、文字翻译、数学题解答等 功能。例如,它能快速计算食物卡路里含量,并即时显示。此外,Rokid Glasses 也将接入支付宝旗下的“AI 生活管家”支小宝,引入 AI 办事、声纹支付等能力, 用户可语音唤起支小宝,让 AI 点餐、打车。
(4)李未可:聚焦户外场景,打造多模态个人助手。李未可公司创立于 2021 年,基于用硬件强化 AI 的理念,选定眼镜这一载体, 投身 AI+ 眼镜赛道。公司发展路径为:1)先通过骑行这样的刚需垂类场景实现 快速落地,深入了解用户的户外需求,积累数据,优化产品方案;2)逐步覆盖 国内海外的户外重点垂类用户场景,包含骑行、徒步、日常通勤等,并不断打磨 自研的各个垂直领域的多模态任务大模型,积累多场景的 AI 助手服务能力;3) 李未可品牌成为一个多场景通用场景的 AI+AR 眼镜品牌,大模型会帮助李未可 AI 数智人家族成为用户在不同场景下的 AI 助手,且能打通除 AR 眼镜外的多硬 件设备终端如手机、电脑、耳机等,让 AI 助手围绕用户生活,提供全方位的效 率型刚需服务。 李未可推出智能眼镜专研的 WAKE-AI 大模型,同月推出 AI 智能眼镜 Chat 。 2024 年 4 月 26 日,李未可科技推出旗下首款 AI 眼镜——Meta Lens Chat,该 眼镜主打 AI 语音交互功能,通过点触镜腿唤醒 AI 语音助手,开启超拟人的 AI 语音交互新体验,售价 699 元。Meta Lens Chat AI 眼镜搭载了自研大模型 WAKE-AI,不仅能在 500 毫秒内快速响应用户指令,还支持百科问答、学习辅 助、英文翻译、语音导航、情感陪伴等多种功能。其内置的 WAKE-AI 大模型具 备文本生成、语言理解等多模态交互能力,并能通过云端服务实现超快速响应, 满足不同场景下的功能使用。
李未可新品 AI 眼镜 Meta Lens View 亮相 CES,增强拍摄功能。AI 眼镜 View, 除了第一代原有的语音交互能力外,重点放在了拍摄能力上。Meta Lens View 搭载了第一代骁龙 AR1 平台、索尼 IMX681 芯片,重量控制在 40g 以内。Meta Lens View 将为用户带来全新的 AI+拍摄体验,并引领智能穿戴设备市场的发展 潮流。
5、Agent 终将实现 AI 普惠新纪元
我们认为在 AI 应用的大浪潮中,Agent 将成为最耀眼的产品,未来 Agent 仍将 不断进化迭代,实现 AI 普惠新纪元。 Agent 技术将不断提升智能化和自动化程度,能够处理更复杂的任务。如自主学 习、自我优化和多任务处理。这将显著提升传媒行业尤其是电商领域的生产效率 和运营效率。企业可以利用 Agent 为用户实现高效且智能化的购物、订机票等购 物流程,重塑用户的消费体验。 企业将更加注重数据的收集和分析,利用大数据和机器学习技术优化 Agent 的 性能。通过分析用户行为数据和内容表现数据,Agent 可以不断优化内容生成和 推荐策略。传媒企业可以通过分析用户行为数据和内容反馈数据,优化 Agent 的推荐算法和内容生成策略,提升用户体验和内容质量。 传媒企业将加强与其他行业的合作,将 Agent 技术应用于更广泛的领域。例如, 企业与手机、眼镜等端侧厂商合作,通过端侧 AI 模型深度融合至操作系统,实 现文本总结、邮件自动回复、电商购物、股票交易等智能化功能,逐步替代传统 APP 交互模式。通过跨领域合作,形成 Agent 技术的生态化发展,提升企业的 竞争力和创新能力。