全球ICT终端设备市场规模稳步增长,5G和AI技术是推动这一增长的核心动力,而DeepSeek在其中发挥着重要的赋能作用。
1.“杰文斯”悖论再次到来,算力需求将迎来长周期繁荣
DeepSeek工程优化节约训练成本,中长期来看算力需求依旧强劲。DeepSeekV3通过训练与算法等工程优化,训练成本大幅降低。DeepSeek-V3于2024年12月26日发布,是一个强大的混合专家模型(MoE),共有6710亿个参数,每个token激活370亿个参数。DeepSeekV3开创了无需辅助损失的负载均衡策略,并设定了多token 预测训练目标来获得更强的性能,通过使用14.8万亿个多样化且高质量的token进行预训练,随后进行监督微调(SFT和强化学习(RL)。通过采用多头潜在注意力(MLA)和DeepSeekMoE架构,有效的降低了训练成本并实现了高效推理,论文表示,DeepSeekV3完整训练仅需278.8万H800GPU小时,且训练过程非常稳定,没有遇到任何不可恢复的损失峰值且没有进行任何回滚。
DeepSeekR1采用群组相对策略优化(GRPO)算法,进一步降低训练成本。DeepSeekR1与2025年1月20日正式发布,并同步开源模型。DeepSeekR1完全摒弃SFT,核心技术为GRPO算法,其通过组内相对奖励来优化策略模型,进而对训练过程进行简化,减少训练中计算资源的消耗,无需额外的“评估模型”或者“批评模型”来评估当前策略的优劣,通过强化学习(RL)从基础模型中激发推理能力,专为复杂推理任务而设计,尤其在数学、代码生成和逻辑推理领域表现尤为突出,在MATH-500测试中,DeepSeekR1得分97.3%,高于GPT-01的96.8%。

整体来说DeepSee在工程复杂度上大幅提升,即通过调整模型架构、训练精度、算法,且数据质量方面差异化导致单次训练成本大幅降低:
1)DeepSeekV3采用稀疏 MoE架构,激活参数量降低:OpenAI采用密的Transformer架构,即需要在每个前向/后向传播过程中激活并更新全部参数,因此在大规模训练时对算力与显存需求很高,但 DeepSeekV3在训练或者推理过中只会激活少量参数,有效降低每次前向/后向的计算量,降低整体训练成本。
2)DeepSeekV3采用FP8混合精度训练,提升计算效率:OpenAI在训练过程中多采用FP16精度,兼顾数值稳定和计算效率,而DeepseekV3采用了FP8混合精度训练,从而提升单位GPU小时的计算利用率,这也是其大幅缩减成本的重要原因之一,与此同时大幅提升工程复杂度。3)DeepSeek蒸馏策略优化,减少对额外RLHF依赖:OpenAI训练数据规模更大,数据更多元化,且在RLHF环节上投入较大,DeepSeekV3数据规模在14.8万亿token,在后训练与蒸馏策略做了优化,减少了对额外 RLHF资源的依赖,并且上文提到 DeepSeekR1 采用群组相对策略优化(GRPO)算法,进一步优化训练成本,但DeepSeekR1整体训练成本要显著高于 DeepSeekV3.总结来说,DeepSeek通过在算法与工程侧的深度合,把相同的算力资源利用率最大化所以我们看到单次训练成本有显著下降。
“杰文斯”悖论再次到来,技术进步反而推动资源使用总量上升,DeepSeek将推动算力需求总量提升。DeepSeekV3以及R1的出现,反而证明了模型的架构演进还在继续,从整个产业链看,预训练、后训练、测试时间计算等不同路径都仍然与创新优化空间。此外,DeepSeek研究员也曾发推文表示 DeepSeek要做开源的 AGI,目前开源已经完成,且如果证明强化学习是通往 AGI时代的正确的道路,对算力的需求只会越来越大,要向上走到AGI依然需要更强算力。当技术进步提高了资源使用的效率,不仅没有减少这种资源的消耗,反而因为使用成本降低,刺激了更大的需求,最终导致资源使用总量反而上升(杰文斯论),微软CEO萨提亚·纳德拉的推文提到了这一点。所以当模型的成本越低,开源模型发展越好,模型的部署、使用就会更高频率、更多数量,对算力的需求将越来越大。
2.算力需求或将出现结构性改变,国产化进程加速推进。DeepSeek发布文生图大模型Janus-Pro,表现优于DALL-E3。从1月28日DeepSeek发布文生图像大模型 Janus-Pro,该模型是Janus-Flow的进阶版本,相比前一代模型,Janus-Pro 在训练策略上进行了优化并拓展训练数据集,模型也更大。在基础测试中超越美国巨头OpenAI,该开源多模态模型在生成遍真图像、执行复杂视觉推理等多种视觉任务方面具备强大优势。深度求索称,Janus-Pro在使用文本提示函生产图像的基础测试中,表现优于OpenAI的DALL-E3 和StabilityAl的 StableDiffusion.
Janus-Pro 准确率大幅提升,推理算力需求占比进一步提升。DeepSeek 表示,在文生图GenEval和 DPG-Bench基准测试中,Janus-Pro-7B 的准确率较上一代Janus 大幅提高,准确率测试结果分别为80%和84.2%,高于包OpenAIDALL-E3在内的其他对比模型。我们认为,DeepSeek的成功路径将推动算力需求结构性改变,未来多模态持续迭代,推动推理端算力需求占比大幅提升。
2.DeepSeek 加速 AGI到来,大模型从“训练”向“推理”演进
DeepSeek将加速AGI时代到来,AIAgent将成为通往AGI的基石。DeepSeekR1是人工智能革命下里程碑式的产品,对标 OpenAI的 o1模型,并且在强化学习的推动下,展现出了此前未曾预见的推理能力,同时通过工程与算法等深度耦合,大幅降低成本,让大模型更易触达下游厂商。并且 DeepSeek开源其模型预示着开源社区正以全新的方式推进人工智能技术的发展,加速通用人工智能时代到来并推动AIAgent技术更加成熟。
AIAgent是一种能自主感知周遭环境,通过内在的智能处理进行决策,并执行相应行动以达成特定目的的智能体。它基于大型语言模型(LLM),集成了规划、记忆、工具和行动能力。从智能助手、个性化推荐系统到自动化客户服务,AIAgent的应用案例层出不穷,它们在各行各业中展现出巨大的潜力和价值。
AI代理的工作流程比传统的LLM交互方式更高效:通过选代式的AI代理工作流程(例如:先写提纲,再进行网络搜索,再写初稿,再修改),可以显著提高AI模型的输出质量,其提升程度甚至超过了模型本身的迭代升级。
3.新一轮“得入口者得天下”,从 APP 到 Agent 与终端生态的转变
技术驱动下的生态重构。在全球数字化浪潮的推动下,ICT行业正经历着深刻的变革,核心入口从传统APP向以AIAgent(智能代理)和终端设备为主导的新生态转移。这一变革的底层驱动力是多元技术的协同突破,而以DeepSeek未代表的大模型推出将加速这一进程的推进。
Al Agent的崛起是自然语言处理(NLP)、机器学习(ML)、知识图谱等技术深度发展的结果。基于 DeepSeek等先进模型开发的 AIAgent,借助深度学习算法,能够精准理解用户问题的意图,从海量知识库中提取准确答案,甚至能依据对话语境进行多轮交互,提供更具人性化的服务机器学习赋予 Al Agent 自主学习能力,使其在与用户的持续交互中不断优化算法,积累经验,从而更精准地预测用户需求。
终端设备与AI的深度融合,是硬件技术与AI算法相互赋能的成果。以智能家居领域为例,智能音箱、智能摄像头等设备通过内置 AI芯片和算法,实现了“无感化”服务。从算法层面,不断优化的AI算法让设备能够更精准地识别用户声音、理解用户意图,实现智能化控制,而从硬件层面看,低功耗、高性能的AI芯片将为设备实时处理复杂语音和图像数据提供了便利。DeepSeek的出现进一步提升了终端设备的智能化水平。例如,搭载DeepSeek算法的智能音箱,在语音唤醒、语音识别、语义理解和语音合成等方面表现更为出色,用户只需简单的语音指令,就能完成音乐播放。信息查询、家居控制等操作,极大地提升了用户体验,重塑了流量入口格局。

AlAgent的市场规模与增长潜力巨大。中国AAgent市场呈现出迅猛的发展态势,预计到2028年,其市场规模预计将达到8520亿元,年复合增长率高达72.7%,DeepSeek在这一增长趋势中扮演着重要角色。
从供给端来看,以 DeepSeek为代表的先进模型技术的成熟是关键因素。DeepSeek基于海量文本数据训练,具备强大的泛化能力,能够快速适应不同领域的应用需求。企业只需在DeepSeek基础上进行微调,就能开发出适用于特定行业的A1Agent,降低了开发成本和周期,加速了AIAgent市场的扩张。
从雷求端来看,各行业数字化转型加速,对智能交互和自动化决策的需求激增。比如:在金融行业,DeepSeek凭借其强大的语言理解和分析能力,能够更精准地解读金融数据和市场动态,为投资者提供更具前瞻性的投资建议,基于其开发的AIAgent可被广泛应用于智能投研、投资顾问风险评估和客户服务等环节;在医疗行业,AlAgent辅助医生进行疾病诊断,通过分析患者病历、影像数据和医学文献,快速给出诊断建议,提高诊断效率和准确性,DeepSeek能够对海量医学知识进行深度挖掘和理解,为医疗诊断提供更全面、准确的参考。随着5G、物联网等技术的普及,产生了海量数据,这些数据为基于DeepSeek开发的AIAgent训练提供了丰富素材,将进一步推动其在各行业的应用。
DeepSeek的加入终端设备的生态重构。全球ICT终端设备市场规模稳步增长,5G和AI技术是推动这一增长的核心动力,而DeepSeek在其中发挥着重要的赋能作用。
5G技术的商用,为终端设备带来了高速率、低时延和大连接的网络环境。在工业物联网领域5G使工厂设备实现高速互联,大量生产数据能够实时传输到云端或边缘计算节点进行分析处理DeepSeek能够对这些生产数据进行深度分析,挖掘数据背后的潜在价值,为企业提供更精准的生产优化建议。在智能家居领域,5G保障了智能家电之间的稳定通信,用户可以通过手机或智能音箱远程控制家中设备,实现智能化家居场景。搭载DeepSeek算法的智能终端设备,能够更准确地理解用户指令,实现更智能的家居控制。
AI技术则赋予终端设备智能化的“大脑”。智能家居设备通过AI算法实现智能场景识别和自动控制。DeepSeek的加入,使得智能设备在场景识别和决策制定方面更加精准和高效。例如,智能灯光系统可以根据环境光线、用户活动状态自动调节亮度和颜色,借助DeepSeek的强大分析能力,灯光系统能够更好地理解用户的生活习惯和需求,提供更贴心的服务。物联网终端借助AI实现设备故障预测和智能运维。DeepSeek能够对设备运行数据进行实时监测和分析,提前预测设备故障,为企业节省维护成本,保障设备的稳定运行。这些技术升级提升了产品附加值,刺激了市场需求,推动终端设备市场持续增长。
AIagent模型通过实现自然语言与硬件的交互,解决端侧AI痛点。端侧AI之前的痛点之一是无法通过用户指令调用操作界面并实现用户目标。最新的agent智能体模型比如Caude3.5Sonnet、智谱AutoGLM 以及OpenAI即将发布的“Operator”可以解决这一难题。Alagent模型与硬件争夺流量入口,ICT未来发展趋势将从当前的APP生态转向模型生态或终端设备生态。在互联网时代,C端用户通过自发向APP输入指令来实现功能;而在Alagent时代,C端用户可以向模型输入指令来实现功能,并且获得模型的双向反馈,模型通过自然语言更好地完成与硬件的交互。这改变了流量入口的分配,Alagent模型将取代APP的地位,并与硬件争夺流量入口。
4.DeepSeek推动 AI Agent崛起,B 端+C 端应用开启新篇章
从Open、歌、Salesforce、Servicenow、Hubspot等全球头部的 AI应用公司新产品即将发布情况来看,AIAgent有望成为2025年AI应用的新趋势。Agent将成为AI落地的最佳选择,市场规模和应用场景将持续扩大。全球头部公司的一致布局代表对AAgent发展前景的认可,Salesforce的股价也因AIAgent产品的推出而跃升至历史高点。
DeepSeek推动AIAgent快速进化,AI应用进入新时代。当前,伴随全球数据量维持高速增长,为AIAgent发展提供数据资源。未来五年,全球数据量将维持增长,2022年,全球数据规模已达到103ZB,中国数据规模达到23.9ZB;预计2027年,全球数据规模可达到284.3ZB,近五年的 CAGR可达到 22%,中国数据量规模则可达到76.6ZB,近五年的CAGR为26%,超过全球增长速度。国产大模型自2023年7月开始进行密集发布,截至2023年7月,国产大模型累计数量达到300个,并且涉及金融、法律、教育、医疗、娱乐等多个垂直细分领域。

5.生态应用统一接口条件下,端侧 AI迎来巨大发展机遇
生态应用统一接口条件下,AI手机、AIPC、AI眼镜等端侧AI能够解决用户痛点,迎来巨大发展机遇。AI手机硬件升级提速,2024年行业创新重点聚焦端侧AI应用。华为鸿蒙通过软硬芯云整合构建了鸿蒙原生智能架构,使AI与操作系统深度融合,用户可通过全局拖拽方式直接处理文字、图片、文档,实现摘要、润色、提取表格等功能;OPPO在FindX7系列中率先集成了端侧AIGC消除、AI通话摘要功能;vivo推出了从 10亿到1750亿参数的不同规模端侧模型,构建起较为完整的 AI能力矩阵;小米14 Ultra搭载首个 AI大模型计算摄影平台AISP,通过整合 CPU、GPU、NPU和ISP将AIGC技术应用于数码变焦的实时处理。
Al agent对手机界面的操作是一个复杂任务,而这一难题正通过 AI与端侧结合得以实现。端云结合的方式使得手机既能使用端侧模型,也能利用云端模型,使用agent方式完成操作,以平衡性能、参数和能耗等不足。华为AI助手小艺搭载盘古大模型,现已具备23类TOP场景的记忆感知能力,任务成功率达90%,已实现与300多个重点服务的无缝对接。
联想 Yoga Pro 9i和 Yoga 9i二合一搭载最新的英特尔酷睿 Ultra处理器和联想 AI芯片,配备YogaCreatorZone生成式 AI软件,可将基于文本的描述或草图转换为图像;Aura系列由联想与英特尔合作打造,以“至轻、至强、至AI”为特性,内嵌“天个人智能体系统”,具备自然交互和感知,意图理解和任务规划等功能。
AI 眼镜搭载大模型,功能渐全,迎来发展新机遇。Gyges Labs自研的 DigiWindow技术基于视网膜投影原理,创造了全球最轻、小的近眼显示光学方案,使得智能眼镜实现真正的可全天候佩戴。这款 AI眼镜不仅体积小、重量轻,还能降低功耗,并实现对于近远视的完全视光学兼容。GygesLabs将协同式 AI融入技术中,为可穿戴硬件设备赋予了感知与交互能力,从而进一步拓展了其商业化价值。GygesLabs的 AI眼镜实现了双向同步翻译功能,并且接入多个大模型,如通义千问、百度文心一言等,提供物体识别、文字翻译、数学题解答等多任务处理能力。此外,用户可以在不干扰视线的情况下,接收和发送信息;此款AI眼镜还能够根据用户的需求和环境,智能地提供信息提示,比如日程提醒、天气信息等。