2025年传媒互联网行业AI应用商业化系列:MiniMax,国产全模态多面手,模型与应用飞轮启动

  • 来源:中信建投证券
  • 发布时间:2025/12/18
  • 浏览次数:116
  • 举报
相关深度报告REPORTS

传媒互联网行业AI应用商业化系列:MiniMax,国产全模态多面手,模型与应用飞轮启动.pdf

传媒互联网行业AI应用商业化系列:MiniMax,国产全模态多面手,模型与应用飞轮启动。背景:全模态大模型竞争基本进入“决赛圈”,还在牌桌上的玩家,未来商业化空间可期。大模型竞争加剧,大模型公司已从23年的“百模大战”缩减至目前的数十家,尤其是从近期Gemini-3的惊艳表现可知,全模态模型的稀缺性高,全球核心玩家包括OpenAI、谷歌、阿里、字节、MiniMax、智谱等。随着大模型智能水平的快速提升,模型公司率先在应用端实现快速商业化,如OpenAI的ARR在2025年内将实现100到200亿美元的跨越,预计2030年达数千亿美元;Anthro...

模型与应用双轮驱动,生态卡位稀缺

前言:全模态大模型决赛圈正在收敛——MiniMax是核心玩家之一

从23年“百模大战”至今,目前仍大规模投入模型迭代、全模态布局的公司已大幅减少。尤其是从 近期Gemini-3的惊艳表现可知,在多个模态都没有明显短板的全模态模型稀缺性高。

MiniMax在23年发布语音合成模型,24年发布视频和音乐生成模型,25年再度拓展至Agent和编程领 域,一年突破一个模态。目前在文本/编程、视频、语音/音乐三大模态均全球领先,模型综合实力 位于第一梯队。

模型与应用双轮驱动,长期实现AGI

MiniMax是国内最早一批大模型公司之一,技术与产品布局领先。MiniMax成立于2021年底,遵循 模型与应用同时发展的思路,目前已布局四大模型和四大应用。 模型:包括MiniMax M2、Hailuo 2.3、Speech 2.6 和 Music 2.0,具备强大的代码和Agent能力, 以及超长上下文处理能力,覆盖文本、音频、图像、视频、音乐全模态。 应用:包括海螺AI、Talkie AI(星野)、 MiniMax Agent 和MiniMax Audio,分别聚焦视频生成 、社交陪伴、通用Agent和语音生成四大热门的AI应用赛道。

同时覆盖大模型和应用层,商业化空间大

随着模型性能增强,模型与应用的商业化空间都在快速扩大,同时布局模型和应用的公司有望率先 受益。例如OpenAI预计2025年内ARR完成从100亿美元到200亿美元的跨越,2030年ARR达数千亿美元 ;Anthropic的ARR从2024年底的10亿美元快速增长至2025年7月的50亿美元,2028年达800亿美元。 MiniMax自成立之初就实现模型与应用的协同发展,目前已覆盖社交、音乐、语音、视频、编程、通 用Agent等热门赛道,且随着模型能力提升,有望快速拓展新应用场景和新客户,驱动收入快速增长 。

全球化布局卓有成效

无论是模型还是应用的发展,MiniMax均同时兼顾国内外市场,业务天花板更高。 模型侧,海螺视频模型在24年发布时就快速在海外出圈,今年基于该模型创作的动物跳水视频在 Instagram的播放量超2亿;语音合成模型已接入Hedra(ARR 1亿美元)、Vapi(ARR 800万美元)等 海外原生AI应用;M2模型在海外大模型聚合平台OpenRouter的调用量连续4周位列全球模型前5。 应用侧,Talkie和星野分别聚焦海外与国内用户,Talkie已成为收入最高、用户规模最大的国产AI 社交应用;AI视频创作工具海螺AI的网站访问量中,海外占比普遍在90%以上。

战略方向经历调整,模型自身能力的迭代是第一要义

24年公司的战略方向经历了调整与优化,对模型技术迭代的重视程度提升。战略调整源于创始人 闫俊杰的认知在改变。25年1月他接受晚点LatePost的采访时曾提到,过去中国人工智能产业总是 认为用户越多,模型能力提升越快,但实际上一般用户反馈的数据,并不能直接提升模型智能;模 型能力的提高需要依靠研发。 1H22-1H24:产品和模型双轮驱动。在该战略引领下,公司早在22年就推出AI角色扮演产品Glow, 后续又推出Talkie/星野、海螺、MiniMax Agent等一系列产品。

公司发展节奏快,战略布局前瞻性强

回顾公司的发展历程,很多战略布局都具备前瞻性,整体发展节奏领先同行,具体而言:率先布局MoE架构。23年下半年MoE架构还没有被行业认可时,公司就率先完成核心MoE算法技术路线 的突破,并在24年初上线国内首个MoE文本大模型abab 6。MoE架构推理速度更快、算力利用效率更 高,在abab6.5s中,MoE架构比原来主流的Dense架构快3-5倍。后来MoE架构陆续成为主流的大模型 架构,DeepSeek、Gemini、Qwen等模型均采取该架构。

应用布局:覆盖热门赛道,出海步伐快、商业化节奏清晰

语音:公司最早落地的场景之一,应用广泛

MiniMax早在23年就发力语音合成和音乐生成场景,是国内发力最早、步伐最快的公司之一。23年 11月公司发布首款语音大模型abab-speech-01,3个月内超过400家企业用户接入;24年1月新增多 角色音频生成 API、文本角色分类 API 和快速复刻 API三大接口,是第一个开放多角色配音商用 接口的公司;24年8月,在语音大模型服务超2000家客户的同时,新发布音乐模型 API,实现语音 合成与音乐生成全覆盖。目前语音方面的具体应用场景包括AI配音翻译、AI播客、智能硬件语音交 互、智能外呼等十余种场景。

语音:已拓展部分海外客户,以原生AI应用为主

公司的语音模型已接入多个海外原生AI应用,反映模型的综合表现拥有与OpenAI、ElevenLabs、谷 歌等海外头部语音模型同台竞争的能力。目前接入的原生AI应用以语音生成工具和AI广告视频创作 工具为主,为它们提供语音合成能力。部分应用会同时接入多个模型,供客户自由选择,如数字人 生成和AI视频创作平台Hedra,除了MiniMax的模型以外,还接入了可灵、谷歌Veo和自研模型。

编程:MiniMax M2调用量起量快,编程是第一应用场景

10月底M2模型发布后,Token调用量快速增加,成为同期OpenRouter调用量最大的国产模型。看M2在OpenRouter的调用量:自发布当周开始,M2的调用量连续4周位列全球模型前5,国产模型第 1。且成为首个日度调用量超50B的国产模型,目前稳定在30B左右。 看M2在HuggingFace上的热度排名:11月初位列HuggingFace Trending榜单全球第1名,11月21日仍 位列第16名。榜单衡量模型在该平台上的搜索热度, 反映中小开发者对模型的关注度也比较高。

视频:海螺1.0发布之初就凭借热门作品在海外出圈

24年9月海螺视频模型发布之初,就凭借细致真实的人物情感表现效果、运动幅度稳定性、电影感 等优势,成为继可灵后第二款在海外出圈的国产视频模型。当时海螺生成的短视频在X、Youtube 等社交平台快速传播,无论是“宇航员+怪兽”的科幻视频,还是展示女生“从开心到悲伤”的写 实表情变化视频,都在X上实现超百万播放量。 海螺模型的海外出圈,驱动网页版访问量快速增加。其中24年9月环比增速超900%,25年2月达到 峰值2943万。25年3月开始出现波动,主要是因为此前海螺AI包括视频、音乐、AI助手三大功能, 3月开始将AI助手单独出来,命名为MiniMax,海螺AI仅保留视频和音乐功能。

社交:Talkie用户规模和商业化规模位居在国产产品中位列第一

目前商业化落地较快的国产AI陪伴产品主要包括Talkie、星野、猫箱和Linky,其中收入规模最大、 用户规模最多的预计是MiniMax的Talkie(24年数千万美元量级)。

模型布局:全球少数在文本、视频、音频三大模态均领先的公司

MiniMax是少数在四大领域均实现全球领先的公司

MiniMax是全球少数在文本、编程、视频、语音 四大领域均实现全球领先的公司,后续有望做多 模态融合,将各个模态的性能汇集到一个模型里。文本:公司发布的M2模型,综合性能评分Artificial Analysis Intelligence排名全球第8,其中在开源模 型中排名全球第2; 编程:编程能力同样由M2模型承担,编程测试评 分SWE-bench Verified达69.4%,仅略低于Claude Sonnet4.5、GPT5.1、Gemini3 Pro。

以M2模型为例,率先在效果、价格和速度上取得较好的平衡

模型通常陷入“不可能三角” ,即海外最好的模型可以有不错的效果,但是价格非常贵且推理速 度比较慢;国内的模型价格也相对便宜,但是效果和推理速度有差距。而M2模型率先在效果、价 格和速度上取得较好的平衡。对比综合性能和价格,M2性能与GPT5、Claude4.5 Sonnet处于相 近的水平线,但价格仅为它们的10%以内,且全面开源;对比速度和价格,M2在主流模型中仅略 低于Claude 4.5 Haiku和Grok4 Fast,但价格分别为它们的20%和持平。

报告节选:


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至