国内大模型瓶颈及商业化难点在哪?

国内大模型瓶颈及商业化难点在哪?

最佳答案 匿名用户编辑于2025/07/24 09:08

国内大模型的瓶颈,以及国内商业化的难点。

1.国内大模型瓶颈:核心依然是算力受限,从而导致技术路线创新缓慢

我们认为,制约国内大模型发展的瓶颈有四个,其中高性能算力是最核心的根源。1)瓶颈#1:高性能算力受限,单集群大小受限。不可否认,国产算力已经有了突飞猛进的进展,25 年 5 月发布的 718B 参数稀疏 MoE(推 理激活 39B)模型 Pangu Ultra 完全在 910B 平台上完成了训练,并实现 6K Ascend NPUs 上 30.0%的模型浮点运算利用率(MFU)和 1.46M 的每秒 token(TPS)。然而,目前仍然 有相当一部分的国内模型是在 Nvidia 的 GPU 以及 CUDA 生态上训练的。由于宏观等因素, 国内相比海外在Nvidia GPU的先进性以及单集群大小上有较大差距(高性能GPU的代差, 以及节点内 scale up 和节点间 scale out 的差距),即使国内外采取相同的技术路线,在实 际工程实现上依然存在较大算力局限,瓶颈凸显。

2)瓶颈#2:国内高价值用户数据或较少。我们认为,大模型产品或沿袭了互联网产品路径:先占据用户心智,再放大头部效应。头 部效应能够吸引正向的用户反馈,反过来帮助产品迭代。例如,在 Google Search 里,用 户遇到无关结果会先反思并修改关键词,从而持续向 Google 输送高质量关联性数据;而对 于 Bing Search,在相同情境下,用户却把责任归咎于 Bing“不够好用”,从而转向更为头 部的“Google Search”。大模型领域亦然,若一般模型失准,用户直指模型缺陷,而当 ChatGPT、Claude 出错,用户本能调整 prompt,继续贡献正向迭代样本。这样,头部模 型汇聚全球场景数据并形成正向循环,而国内模型多依赖本土使用习惯,高价值用户数据 相对稀薄,迭代速率受限。Kimi 通过投流扩张并无误,但 DeepSeek 选择先拉升模型智能, 更贴近破解这一数据瓶颈的核心路径。

3)瓶颈#3:全球头部模型愈发闭源,国内资源受限大多跟随。海外头部厂商继续在模型架构上递进创新,但创新日益闭源。OpenAI o 系列向外界展示了 “强化学习”的新迭代范式,却未透露核心工程框架。国内 DeepSeek、Kimi 等在“强化 学习”大方向的指导下,摸索出了高效的强化学习路径,但时间上略落后于海外。此外, 学术界虽然持续输出开源论文与权重,但算力、数据、工程体系与 OpenAI、Anthropic 等 模型巨头不在同一数量级,论文里的 SOTA 成绩在大规模推理场景仍需依赖头部闭源模型 落地。国内团队在缺乏对等资源、工程试错成本高的情况下,大多只能沿主流路线做跟随 升级,较难对闭源壁垒形成有效反制。

2.国内商业化难点:模型仍有差距,且用户付费习惯一般

国内商业化难点,我们认为表面在于用户付费情况一般,本质在于模型相比海外仍有差距。 1)用户付费情况:从表 16 的分析中可以看出,国内 AI 应用收入 Top 31 产品中,有 24 个 产品为出海,出海占比为 77.4%。以收入排名第三的睿琪软件(Glority LLC)和旗下 App 为例,海外应用为 PictureThis,国内为形色。形色在 App 内部未找到明显的收费入口,而 PictureThis 在首次打开 App 时即显示订阅信息(从 App 精致度和更新频率上,PictureThis 优于形色)。另一家 AI 数字人公司 HeyGen 2020 年注册主体诗云科技(深圳)有限公司, 同时把运营和融资中心放在洛杉矶。23 年 12 月,境外新股东 Conviction Partners 入局, 接替了原本由红杉中国占据的董事席位,并实现资本结构、董事会席位与注册地址三线同 步“去中国化”,专注做海外商业化。2)模型差距:在上一节“国内大模型瓶颈”已经阐 述,一方面国内模型相比海外头部仍有差距,另一方面国内模型头部的 DeepSeek 是开源 免费的,两因素叠加,进一步降低了国内用户的付费意愿。

国内商业化突破点:多模态应用先行,实现单点到多点扩张

多模态是国内 AI 应用商业化的突破点,互联网厂商依托自身场景和资源获得先发优势。从 表 16 的分析中可以看出,国内 AI 应用收入 Top 31 产品中,有 21 个产品为多模态,多模 态占比分别为 67.7%,成为了国内 AI 应用的主要商业化形态。其中商业化的典型是快手可 灵,可灵于 2024 年 6 月上线,10 个月实现年化收入 1 亿美金,25 年 4-5 月两个月的月度 付费金额均超过 1 亿人民币,商业化进展迅速。此外,美图的各系列产品也都获得了较好 的商业化变现。对于后续国内商业化,我们认为:1)多模态依然是重要的产品形态,相关 的应用均有机会实现比纯文本形态更好地商业化落地。2)天然有着多模态应用场景的互联 网公司具有较大优势,如美图的图像处理、快手的短视频等场景。3)可灵单点获得成功, 后续更多类似的国内多模态应用有望带来持续的商业化多点扩张。

参考报告

科技行业深度研究:多模态大模型和应用奇点将至.pdf

科技行业深度研究:多模态大模型和应用奇点将至。我们认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术进步方面:原生多模态模型架构得到业界认可,OpenAI和Google的原生多模态模型已经在性能、延时、部署上展现出了优势。2)商业化进展方面:全球维度看,除了最头部的OpenAI和Anthropic依靠模型“智能”实现商业化,相当一部分AI应用公司的商业化产品依赖多模态能力。国内维度看,国内公司在视频生成赛道已经实现了较成熟的全球化和商业化之路。与市场不同的观点在于,1)更早认识到原生多模态架构将成为主流;2)AI商业化不能仅聚焦在二级公司,更要关注全球维度一...

查看详情
相关报告
我来回答