2025年AI+专题报告:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求
- 来源:国信证券
- 发布时间:2025/02/06
- 浏览次数:1632
- 举报
AI+专题报告:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求.pdf
AI+专题报告:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求。DeepSeek发展突飞猛进,领跑开源大模型技术与生态,DeepSeek模型已成为全球现象级模型。DeepSeek(深度求索)公司成立于2023年7月,是一家致力于实现通用人工智能(AGI)的创新型科技公司。2024年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型。据官方技术论文披露,V3模型的总训练成本为557.6万美元,对比GPT-4o等模型的训练成本约为1亿美元。2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版。在数学、代码、自然语言推理等任务上,性能比肩OpenA...
DeepSeek发展突飞猛进,领跑开源大模型技术与生态
DeepSeek成立不到两年颠覆开源大模型格局,性能对标海外
DeepSeek(深度求索)公司成立于2023年5月,是一家致力于实现AGI(Artificial General Intelligence,通用人工智能)的创新型科技公司,专注于开发先进的大语言模型和相关技术。DeepSeek由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。
2024年5月,DeepSeek-V2发布,成为全球最强开源通用MoE模型。DeepSeek独创Attention结构MLA(一种新的多头潜在注意力机制)、稀疏结构DeepSeek-MoE在大模型竞技场(LMSYS)位列全球开源模型第一名,依靠创新结构,将推理成本降低近百倍。
2024年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,V3模型的总训练成本为557.6万美元,对比GPT-4o等模型的训练成本约为1亿美元。
2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1正式版。同时DeepSeek开源R1推理模型,允许所有人在遵循MIT License的情况下,蒸馏R1训练其他模型。
DeepSeek模型已成为全球现象级大模型
DeepSeek下载量占据140多个国家榜首。2月1日消息,据彭博社报道, DeepSeek的人工智能助手在140个市场下载次数最多的移动应用程序排行榜 上名列前茅,其中印度占据了新用户的最大比例。据Appfigures数据(不 包括中国的第三方应用商店),这款推理人工智能聊天机器人于1月26日升 至苹果公司应用商店的榜首,此后一直占据全球第一的位置。
国外大型科技公司已上线部署支持用户访问DeepSeek-R1模型。1月30日, 微软宣布DeepSeek-R1模型已在Azure AI Foundry和GitHub上提供。1月31 日,英伟达宣布DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达 面向开发者的网站上发布;同日亚马逊宣布,客户现已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。
硅基流动和华为云宣布上线DeepSeekR1/V3推理服务。2月1日,华为云 官方发布消息,硅基流动和华为云团队联合首发并上线基于华为云昇腾云 服务的DeepSeekR1/V3推理服务。该服务具备以下特点:1)得益于自研推 理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型 可获得持平全球高端GPU部署模型的效果。2)提供稳定的、生产级服务能 力,让模型能够在⼤规模生产环境中稳定运行,并满足业务商⽤部署需求。 华为云昇腾云服务可以提供澎湃、弹性、充足的算力。
DeepSeek-V3通过MLA和DeepSeekMoE实现高效的推理和低成本训练
DeepSeek-V3以Transformer框架为基石,创新性地融入多头潜在注意 力(Multi-head Latent Attention,MLA)和DeepSeekMoE架构。这一设计 在维持模型高性能的同时,极大地提升了训练与推理的效率。
多头潜在注意力(MLA):在传统的注意力机制中,推理期间的键值(KeyValue,即KV)缓存往往占用大量资源。而MLA则另辟蹊径,通过低秩联合压 缩技术,大幅削减了注意力键(keys)和值(values)的存储空间。在生成过 程中,仅需缓存压缩后的潜在向量,这一举措显著降低了内存需求,但在 性能上与标准多头注意力(Multi-head Attention,MHA)相比毫不逊色,有 力地保障了模型运行的流畅性。
DeepSeekMoE架构:该架构采用了更为精细粒度的专家设置,还特别将 部分专家设定为共享专家。在每一个MoE层中,都由共享专家和路由专家协 同构成。其中,共享专家负责处理所有token的输入信息,为模型提供基础 的处理支撑;而路由专家则依据每个token与专家之间的亲和度分数(这一 分数通过sigmoid函数计算得出,即token-to-expert affinity)来决定是 否被激活。这种独特的设计,使得模型在处理不同类型的输入时,能够更 加灵活且高效地调配资源,进一步提升了整体的运行效率和表现。
AI应用爆发在即,算力需求持续攀升,关注ASIC及服务器产业链
Scaling Law与“涌现”能力:大模型训练遵循的重要法则
Scaling Law:模型效果随模型规模指数增加而线性提高。据OpenAI发布的论文《Scaling laws for neural language models》,模型性能极大依赖训练规模,模型参数、数据集大小以及用于训练的计算量增加 可以达到减少模型损失,增加大模型性能的效果。
“涌现”能力:随着训练规模不断增大,大模型将产生质变。据《Emergent Abilities of Large Language Models》,随着模型规模的扩大,语言模型表现出的新的、不可预测的能力。这些新能力在中小模 型上线性放大都得不到线性的增长,但在模型规模突破一定阈值时突然出现。“涌现”能力反映了系统行为质 的变化,这种变化不能简单地通过观察或分析较小规模模型的性能来预测。
自1956年计算机专家约翰·麦卡锡提出“人工智能”概念以来,在过去的近70年时间里,行业经历了以CNN为代表的传统神经网络模型、以Transformer为代表的全新神经网络模型、以GPT为代表的预训练大模型这三个时代的进阶,在“算力芯片、存储芯片”等硬件技术持续演进的支撑下,伴随模型参数规模超越千亿级,近年来人工智能技术得以“涌现”出更加强大的理解、推理、联想能力。
Scaling Law与“涌现”能力:大模型训练遵循的重要法则
海内外科技公司纷纷发布AI大模型,模型的更新迭代和竞争加剧。据中国信通院数据, 截至2024年7月,全球AI大模型数量约1328个(包含同一企业、同一模型的不同参数版本), 其中美国AI大模型数量位居第一位,占比44%,代表性模型包括OpenAI的GPT、Anthropic的 Claude、Meta的Llama、Google的Gemini等;中国AI大模型数量位居第二位,占比36%,代表 性模型包括阿里的通义千问、腾讯的混元大模型、百度的文心一言、月之暗面的Kimi、字节 跳动的豆包等。
模型参数规模呈现指数级增长,模型性能持续提升。近年来新推出的大语言模型所使用 的数据量和参数规模呈现指数级增长,例如GPT-3模型参数约为1750亿,据Semianalysis推 测GPT-4参数量达1.8万亿;同时,国内目前公布的大模型参数规模也普遍在百亿至千亿级 别。性能方面,据Data Learner数据,GPT-4o在MMLU测评中获得88.7分的高分,分数较GPT3大幅提高;国产模型中阿里的Qwen2.5-72B取得86.1分的高分,在各大模型中亦取得排名相 对靠前的位置。
AI模型已从大语言模型进化为全方位多模态模型,开启AI应用新纪元
23年3月以来,OpenAI所发布的GPT-4已经具备了多模态理解和多类型内容生成的能力,使得AI真正具备了重塑人 机交互模式、全方位赋能人类生活的可能性。
24年12月OpenAI连续进行新品发布,包括具备多模态推理能力的完整版o1模型,正式发布Sora视频模型,开放并 升级写作和编程工具Canvas,将ChatGPT与Apple生态深度整合、Siri与Apple Intelligence智能协同,发布了ChatGPT 能够进行视频聊天的语音和视觉功能等。
字节跳动自24年5月豆包大模型家族正式发布到12月短短7个月时间,发布了Doubao-pro、Seed-TTS、Seed-ASR、 Seed-Music、SeedEdit、视频生成模型、视觉理解模型等多项重磅成果,在语言能力、多模态理解与生成、模型推理、 代码生成等方面不断提升。
AI赋能下的“场景数字化”经济效益显著
数字化解决方案的潜在价值对应近27万亿美元。数字化转型是以价值驱动的,其需求来源于企业即通过数字化来解决业务痛点、创造真实价值。根据华为的数据,制造业、金融保险、零售、能源电力等产业的数字化潜在价值均在2万亿美元以上;以作为支柱性工业的制造业为例,多为重资产企业,且流程复杂,需要在制造、运输、管理等多个环节进行数字化应用以实现降本增效,转型诉求强,数字化创造的潜在价值达6万亿美元。
随着企业对数据的需求从收集到理解并进行应用过渡,AI是挖掘数据价值的重要工具。根据华为的数据,家电行业的大模型-AI质检系统借助AI能力,质检速度提升了数十倍。通过机器视觉+AI的方式实现产品外观质量检测的自动化、智能化,系统能够使得检测速度提升10倍以上,缺陷检出率达到98%,进一步提高了质检质量,提高良品率,并且帮助企业节约因质量问题产生的退换货成本。同时,该系统能够帮助企业大幅减少质检工时,降低了人力成本。
AI推动全球IT支出增长,生成式AI市场规模持续提高
AI技术在企业端部署和应用推动全球IT支出的增长。AI技术的发展驱动企业业务自动化、帮助企业优化资源配置并协助数据分析,从而提升业务流程效率,推动企业的智能化转型需求。个性化服务和智能应用带来了新的市场需求,以AIGC为代表的AI应用需要强大的计算能力和数据存储,推动了高性能计算、数据管理以及云计算的相关投资。随着AI应用的增多,企业对网络安全和合规服务的需求也在增加,推动相关领域的IT支出增长。据Gartner预测,企业机构将于2024年加快投资于使用生成式AI,2024年全球IT总支出预计将达到5万亿美元,较2023年增长6.8%;中国IT总支出预计将达到3.9万亿元,较2023年增长6.2%。
AI技术将产生巨大的经济影响,其投入产出效益显著。据IDC数据,预计到2030年,人工智能对全球经济的累计影响将达到19.9万亿美元,占到预计2030年全球GDP的3.5%。到2030年,每在AI解决方案和服务上花费1美元,将产生4.6美元的经济效益,包括直接影响和间接影响。
生成式AI市场将成为当前最热门的IT领域。据IDC数据,24年中国生成式AI市场预计将达到33亿美元,预计到2028年将达到135亿美元,2024-2028年复合增长率将达33.4%,同时生成式AI市场规模占到整体AI市场规模的比例将由16%上升到29%。对于企业来讲,对于生成式AI的支出亦将经历不同阶段的重点,例如2024-2025年,支出主要集中在生成式AI基础设施建设;2025-2026年,支出重点用于推进生成式AI平台与解决方案建设;2027年及以后,支出重点着力于生成式AI服务。
报告节选:



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 正泰安能:向设计要效益:AI自动化设计的实践与回报.pdf
- 艺恩报告:智驾未来:AI重塑汽车消费新纪元.pdf
- 清鹏算电:AI与电力市场应用探索——清鹏能源大模型智能体实践与展望.pdf
- 启信慧眼:全球布局洞见先行:构建AI时代的供应链韧性-2026供应链风控白皮书.pdf
- 计算机:通过AI原生,提升驾驶敏捷性和商业价值统一采购平台(英文版).pdf
- 商品周度报告:节后去库偏慢,双焦核心仍看需求.pdf
- 心声公益:中国儿童青少年精神障碍人士照顾者需求调查报告(2025).pdf
- 股市需求冲击与企业反应.pdf
- 资金行为研究双周报:资金共识犹待凝聚,红利配置需求增强.pdf
- 广发宏观:需求端补短板,驱动力再优化,2026年中观环境展望.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 人工智能AI产业链全景图.pdf
- 2 铀行业专题报告:AI时代的关键资源品,全球核电复兴,铀矿景气反转.pdf
- 3 元宇宙177页深度报告:人类的数字化生存,进入雏形探索期.pdf
- 4 智慧城市专题研究:AIoT时代的智慧城市跃迁.pdf
- 5 2024年AI医学影像行业发展现状与未来趋势蓝皮书.pdf
- 6 中国AI智慧操场行业研究报告.pdf
- 7 人工智能行业专题报告:从CHAT~GPT到生成式AI(Generative AI)-人工智能新范式,重新定义生产力.pdf
- 8 5G+AI的杀手级应用:VR+AR深度研究报告.pdf
- 9 埃森哲人工智能应用之道(92页).pdf
- 10 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 1 中国AI智慧操场行业研究报告.pdf
- 2 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 3 金域医学研究报告:数据资产价值重估,AI技术驱动创新应用场景拓展.pdf
- 4 MIM(金属粉末注射成型)行业专题报告:MIM在机器人、AI、消费电子领域应用前景广阔:破界生长,智领未来.pdf
- 5 医疗AI专题报告:多组学篇,AI技术驱动精准诊断实现重要突破.pdf
- 6 AI的宏观悖论与社会主义全球化.pdf
- 7 洞隐科技2025中国物流与供应链领域AI应用研究报告.pdf
- 8 电力设备与新能源行业深度报告:AI动力打造固态电池发展新引擎.pdf
- 9 2025年金融服务业中国AI现状与趋势.pdf
- 10 人工智能行业分析:AI新纪元,砥砺开疆·智火燎原.pdf
- 1 讯飞医疗科技公司研究报告:AI医疗先行者,贯通式布局医疗信息化.pdf
- 2 医药生物行业医疗器械2026年度策略:把握出海陡峭曲线,卡位AI医疗商业化落地.pdf
- 3 艾瑞咨询:2025年中国企业级AI应用行业研究报告.pdf
- 4 新经济中工作的四大未来:2030年的AI与人才(英译中).pdf
- 5 2026年半导体设备行业策略报告:AI驱动新成长,自主可控大时代.pdf
- 6 青矩技术公司研究报告:全过程工程咨询服务领军者,积极布局AI推行数智化咨询新模式.pdf
- 7 AI医疗行业专题报告:AI重构医疗,从场景落地到变现讨论.pdf
- 8 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 9 2026年AI行业应用深度展望:AI应用重塑流量格局,字节阿里腾讯C端布局加快.pdf
- 10 讯飞医疗科技公司研究报告:AI医疗龙头,GBC全场景贯通&中试基地卡位明确,规模化落地有望加速.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
