计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf

  • 上传者:y****
  • 时间:2026/02/14
  • 热度:145
  • 0人点赞
  • 举报

计算机行业DeepSeek:加速迭代的开源大模型引领者。DeepSeek:长期主义,引领开源模型生态。1)引领开源模型生态,重塑 AI 产业格局。 深度求索(DeepSeek)于 2023 年 7 月正式成立,由梁文锋旗下的量化投资机构幻方 量化设立。2025 年 1 月 20 日,推理模型 DeepSeek-R1 凭借更低的训练成本以及领先 的模型能力,打破国外模型的垄断地位,加速 AI 技术平权,深刻影响了全球 AI 产业格 局。2)组织架构扁平,团队年轻化。DeepSeek 团队规模不到 140 人,组织架构扁平, 核心技术人员主要来自国内顶尖高校。3)估值方面:深度求索坚守长期主义,不以短 期商业利益为导向,至今未进行过外部融资,截至 2025 年 9 月 30 日,DeepSeek 估 值预计达到 1.05 万亿元。

复盘:低成本部署,推动 AI 应用落地“奇点”。DeepSeek 持续推动模型训推成本优化, 在算力资源有限的情况下突破模型的数学、代码、复杂推理能力上限,推动垂直场景及 端侧 AI 应用落地。1)DeepSeek-V3:极致降本,指明模型进化第二路径。2024 年 12 月,公司推出 DeepSeek-V3,训练成本仅 557 万美元,性能表现比肩 GPT-4。DeepSeekV3 采用了自研 MoE 架构、多头潜在注意力(MLA)机制、FP8 混合精度技术、多 token 预测等核心技术,大幅降低了模型的训练及推理成本。2)DeepSeek-R1:推理能力领 先,推动 AI 应用落地。2025 年 1 月,公司发布推理模型 DeepSeek-R1 正式版,推理 性能对齐 OpenAI-o1,模型可以低成本私有化部署,很大程度上推动了金融、医疗、政 务等垂直场景以及端侧 AI 的应用落地。

展望:V4 有望 2 月发布,应用生态潜力较大。1)模型:关注 V4 模型降本及编程能力 提升。根据 The Information 的报道,DeepSeek 有望在 2 月中旬发布新一代旗舰模型 V4,内部测试显示 V4 的代码生成和处理能力,超越了 Claude 和 GPT 系列模型。根 据近期 DeepSeek 对于 mHC、Engram、DeepSeek OCR-2 等技术更新,预计后续模 型有望在模型成本下降、参数规模扩大、长上下文窗口、AI 编程、多模态理解、Agent 能力等方面进一步突破。2)应用:生态能力为大模型商业化核心壁垒。现阶段 AI 竞赛 从比拼模型能力逐步转向在现实世界中大规模部署落地,我们判断 DeepSeek 后续的 商业化有望加速。基于其开源策略、领先模型能力和更低部署成本,DeepSeek 有望成 为 AI 通用基础设施,后续有望嵌入到海量 B 端和 C 端 AI 应用产品中。目前,DeepSeek 已全面接入云厂商、三大运营商,并与办公、手机、汽车、金融、医疗等行业客户广泛 开展合作。

1页 / 共19
计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第1页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第2页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第3页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第4页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第5页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第6页 计算机行业DeepSeek:加速迭代的开源大模型引领者.pdf第7页
  • 格式:pdf
  • 大小:1.5M
  • 页数:19
  • 价格: 3积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至