2025年DeepSeek十大关键问题解读
- 来源:国海证券
- 发布时间:2025/02/14
- 浏览次数:623
- 举报
DeepSeek十大关键问题解读.pdf
DeepSeek十大关键问题解读。DeepSeek探索出一条“算法创新+有限算力”的新路径,开源AI时代或已至,国产AI估值或将重塑。Q1:DeepSeek对于算力的影响?——Jevons悖论:短期训练侧算力需求或受影响,但DeepSeek推理价格下降吸引更多用户调用模型,带来英伟达H100GPU的租赁价格提升,故表明算力需求量短期仍呈提升趋势,中长期推理算力需求有望持续增长。Q2:文本与多模态对算力的需求差别?——多模态模型大规模应用,或将升级算力需求。Sora将大模型训练数据从大规模的文本/图像,发展到视频数据,提升了...
一 、DeepSeek十大关键问题解答
Q1:DeepSeek对于算力的影响?——Jevons悖论
AI的演进路径中,推理成本不断下降,计算效率持续提高是长期趋势。例如:据Semi a n a l y sis,算法进步的速度约为每年4次;Anthropic CEO Dario甚至认为,这一进步速度可能达到10倍。 Jevons 悖论:技术进步提高了资源使用效率,效率提高降低了资源使用成本,成本下降刺激了资源需求的增长,需求增长可能超过效率提升带来的节约,最终导致资源总消耗增加。 我们认为,短期训练侧算力需求或受影响,但De epSe ek推理价格下降吸引更多用户调用模型,带来英伟达H100 GPU的租赁价格提升,故表明算力需求量短期仍呈提升趋势,中长期推理算力需求有望持续增长。
Q2:文本与多模态对算力的需求差别?
多模态大模型是一种基于深度学习的机器学习模型,类似于人脑能够同时处理文本、声音、图像等不同类型的信息,多模态模型能够处理和整合“图像+文本” 、 “视频+音频” 、 “语音+文字”等多种模态的数据和信息,利用不同模态之间的互补和协同,来提高模型的全面感知和泛化能力,使其能够应对更多复杂的任务和场景,以实现更好的性能表现。 与传统的单模态模型相比,多模态对算力供给提出了更高的要求。急剧飙升的算法复杂度及工程难度、模型迭代下动辄千亿规模的参数量和远高于单模态模型的大量图片、文本和视频数据集,不仅需要消耗大量计算资源,对算力的速度、精度、性能等方面的要求也水涨船高。
Q3:对芯片未来格局的影响?
NV仍具备计算与生态护城河。我们认为,DeepSeek的成果使用低精度计算、模型侧发展MOE架构、使用PTX层,这些会带来预训练算力使用效率的提升,但是这些技术仍与NV生态紧密联系,NV护城河仍在。 模型训练算力使用效率提升,NV高等级芯片或主要用于探索AGI。根据《De epSe ek-V3 Te chni c a l Report》,模型的训练过程仅使用2048块H800,这表明使用A100、H800等相对低端的芯片可以实现类似OpenAI o1类似性能。这可能会影响英伟达2025年以后,B200 等最先进GPU的普及,Blackwell/Rubin 等最先进的 GPU 的用途,初期可能会被局限在探索下一代大模型(探索AGI)上。
Q4:De epSe ek系列模型为何引起轰动?——技术与开源
模型的优势点:我们认为,DeepSeek优化模型结构(MLA+MOE)、模型训练方法(DualPipe)、针对性GPU优化(FP8混合精度等)等内容,降低了训练成本,同时进行开源,各下游企业可以直接通过本地部署或云端调用,降低了调用成本。 De e p S e e k的轰动性:1)快速的技术突破:2 0 2 4年9月Op e nAI发布o 1模型,但是2 0 2 5年1月d e e p s e e k就推出类比OpenAIo1的De epSe ek R1,这改变海外对于国内模型能力与迭代速度的认知。2)开源:DeepSeek R1模型实现了开源,采用MIT协议,一定程度打破高级闭源模型的封闭生态。开源免费调用有助于先行占据市场份额,成为规则制定者,率先拓展生态粘性。
Q5:模型未来侧重Dens e还是Spar s e(MOE)?
MoE是大模型架构的一种,其核心工作设计思路是“术业有专攻”,即将任务分 门别类,然后分给多个“专家”进行解决。与MoE相对应的概念是稠密(Dens e) 模型,可以理解为它是一个“通才”模型。一个通才能够处理多个不同的任务,但 一群专家能够更高效、更专业地解决多个问题。
Q6:蒸馏模型的定义与发展潜力?
模型蒸馏作为一种更有效利用先进大语言模型能力的方法,引起了越来越多的关注。通过将知识从更大更强的LLM 迁移到更小的模型中,数据蒸馏成为了一个显著的后发优势,能够以更少的人工标注和更少的计算资源与探索来实现 SOTA 性能。 李飞飞s1-32B模型:据每日经济新闻报道,2月6日,李飞飞团队以不到50美元的云计算费用,成功训练出了一个名为s1-32B的人工智能推理模型。其方法是用从谷歌模型中提炼出来的1000个样本,然后对阿里通义千问(Qwen)模型进行微调而成。
Q7:多模态的演进路径?
AI大模型技术和应用逐渐从文本扩展至更多模态。多模态大一 统模型的理念最早由谷歌提出,Gemini 便是这一理念的代表之 作。其核心设计在于运用 Transformer 架构,将文本、图像、音 频等多种模态的数据进行统一处理,实现对不同模态信息的理解 与生成。
Q8:De epSe ek发生后对应用侧的影响?
核心观点:DeepSeek在推动降本、强推理等层面驱动下,有望加速AI应用普及度迎来跨越式提升。 云端算力是新的卖铲子公司。我们认为,无论是开源还是闭源模型,计算资源都很重要,如果云厂商基于计算资源打造上层服务或产品,那么计算资源的价值就有可能提升,这意味着更多的Capex流向硬件领域,软件也有望受益。 模型厂商:DeepSeek R1模型能力对标OpenAI o1,且开源,对于闭源模型厂商等或造成一定冲击,但其也可在此基础上训练。应用侧:我们认为,C端用户数据基础好、生态和产品力强、与AI结合度好的公司,B端行业市占率高、用户基数大、积累较多用户数据和产品案例的厂商,且具备AI结合能力的公司有望受益。
Q9:De epSe ek发布对于端侧的影响?
DeepSeek产品协议明确可“模型蒸馏” ,有望加速AI端侧落地。DeepSeek决定支持用户进行“模型蒸馏” ,已更新线上产品的用户协议,有望加速AI在端侧进程,未来手机、PC、小型设备等端侧或可部署。我们认为,除AI眼镜和AI手机外,机器人、电子狗、AR/VR设备后期有望迎来快速成长,大模型在端侧的应用发展之后,会进一步带动AI算力硬件的需求。
报告节选:



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
-
标签
- DeepSeek
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 清华大学DeepSeek从入门到精通.pdf
- 2 普通人如何抓住DeepSeek红利.pdf
- 3 Deepseek+外经贸企业创新突围讲义精华全版.pdf
- 4 人工智能专题报告:DeepSeek研究框架.pdf
- 5 人工智能行业专题分析:比较试用DeepSeek看模型走向应用的新迹象.pdf
- 6 Deepseek相关产业专题分析:国产AI应用的“诺曼底时刻”.pdf
- 7 汽车行业专题研究:DeepSeek对智能驾驶影响几何?.pdf
- 8 20250215-清华大学-:DeepSeek+DeepResearch,让科研像聊天一样简单
- 9 DeepSeek R1深度解析及算力影响几何.pdf
- 10 AI+医疗行业专题报告:DeepSeek系列报告之AI+医疗.pdf
- 1 Deepseek+外经贸企业创新突围讲义精华全版.pdf
- 2 博睿数据2025从运维提效到LLMOps如何用DeepSeek铺就大模型可观测性进阶之路.pdf
- 3 2025年华为昇腾服务器DeepSeek V3R1推理部署最佳实践技术报告.pdf
- 4 浙江大学DS系列专题:DeepSeek技术溯源及前沿探索.pdf
- 5 浦东教育发展研究院:浦东新区中小幼教师 DeepSeek等大模型使用指南v1.0.pdf
- 6 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 7 AI赋能资产配置专题报告:DeepSeek解读中央政治局经济工作会议.pdf
- 8 2025年DeepSeek实用指南1.0版.pdf
- 9 通信行业专题研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾.pdf
- 10 2025从DeepSeek到品牌跃迁AI之于品牌的机遇与挑战报告.pdf
- 没有相关内容
- 全部热门
- 本年热门
- 本季热门
- 1 2025年DeepSeek大模型如何助力投研?
- 2 DeepSeekManus与AIAgent行业现状报告
- 3 2025年用DeepSeek优化价量因子
- 4 从Deepseek到Manus:Al如何重塑企业价值报告
- 5 Deepseek对中国算力产业的影响
- 6 北京大学-DeepSeek原理与落地应用
- 7 北京大学-DeepSeek私有化部署和一体机
- 8 DeepSeek企业落地应用讲义精华全版
- 9 北京大学-DeepSeek内部研讨系列:DeepSeek与AIGC应用
- 10 2025年深度解读DeepSeek:部署、使用、安全
- 1 2025年DeepSeek大模型如何助力投研?
- 2 DeepSeekManus与AIAgent行业现状报告
- 3 2025年用DeepSeek优化价量因子
- 4 从Deepseek到Manus:Al如何重塑企业价值报告
- 5 Deepseek对中国算力产业的影响
- 6 北京大学-DeepSeek原理与落地应用
- 没有相关内容
- 最新文档
- 最新精读
- 1 聚焦中国互联网行业:超大盘股四季度业绩展望;关注重点围绕AI智能体OpenClaw、云定价及资本支出(摘要).pdf
- 2 亚太能源行业:上调中国几大石油公司目标价;买入中海油(成本地位领先)、中石油(长期盈亏平衡点下降);调整覆盖范围(摘要).pdf
- 3 政策双周报:“十五五”开局之年,稳总量、优结构.pdf
- 4 中国乘用车行业月度图评:2026年2月_春节期间零售销量疲软符合预期,价格竞争企稳.pdf
- 5 纺织服装行业周报:推荐关注中游困境反转机会.pdf
- 6 易观GEO行业市场分析报告2026.pdf
- 7 源网荷储同类项目投资路径与风险解析.pdf
- 8 正泰安能:向设计要效益:AI自动化设计的实践与回报.pdf
- 9 中国汽车:海外新能源车机遇和可能带来的风险(摘要).pdf
- 10 中国温泉旅游:2025年中国温泉旅游行业发展报告.pdf
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
