2026年MINIMAX_WP公司研究报告:全球化多模态大模型公司,高性价比构筑核心竞争力

  • 来源:国信证券
  • 发布时间:2026/02/14
  • 浏览次数:124
  • 举报
相关深度报告REPORTS

MINIMAX_WP公司研究报告:全球化多模态大模型公司,高性价比构筑核心竞争力.pdf

MINIMAX_WP公司研究报告:全球化多模态大模型公司,高性价比构筑核心竞争力。事项:近期,开源项目Clawdbot在技术社区引发了关注。项目上线初期,MiniMax即接入其技术生态,为开发者提供模型能力层面的支持。国信互联网观点:Minimaxagent能力突出,凭借质价比受到海外开发者好评。开源项目Clawdbot(现已经更名openClaw)在技术社区爆火,Minimax提供底层技术支持。作为一款主力模型,MiniMax2.1在工具调用方面表现出色。更重要的是,在处理此类非极端复杂的全栈任务时,M2.1高效且成本低。相较于Claude等同类型产品,M2.1API与CodingPlan套...

评论:

Minimax agent 能力突出,凭借质价比受到海外开发者好评

开源项目 Clawdbot(现已经更名 openClaw) 在技术社区爆火,Minimax 提供底层技术支持。Clawdbot最初在 GitHub 发酵,短短几天星标数突破 10 万。Clawdbot 项目由创建,于 2025 年底上线。项目上线初期,MiniMax 即接入其技术生态,为开发者提供模型能力层面的支持。作为一款开源、可自行托管的AI助手,Clawdbot 可以在本地计算机上运行,兼容 MacOS、Windows 或 Linux 等多种系统,并可以接入常用聊天工具,如 WhatsApp、Telegram、Discord、Slack、Signal 或 iMessage 等,也可以直接连接GitHub、Vercel、Google Drive 等生产力工具。除内置了多种 Agent 常用的工具外,还可以通过插件和Skills扩展更多能力。在后续的实践案例中,开发者们也选择将 MiniMax 2.1 作为核心引擎来使用Clawdbot,作为自己的日常工作流。 Minimax agent 质价比突出,Clawdbot 火爆后 token 调用量快速提升。作为一款主力模型,MiniMax2.1在工具调用方面表现非常出色。更重要的是,在处理此类非极端复杂的全栈任务时,M2.1 高效且成本低廉,实现了以极低的边际成本撬动巨大的生产力杠杆。相较于 Claude 等同类型产品,M2.1 API 与CodingPlan 套餐的高性价比、大用量及任务处理高效深受用户好评,满足 24*7 小时持续运行。根据Openrouter,Clawdbot 火爆后 token 调用量快速提升,截止 2026/2/8,周度 token 环比调用量同比提升64%。

Minimax 开源新评测集,定义 Coding Agent 的生产级标准

Agent 模型忽视过程正确导致不遵循明确指示。根据 Minimax 公众号文章,在Coding Agent 的实际应用中,公司观察到一个反复出现,却常被忽略的的现象:Agent 不遵循明确给出的指令。当前的学术榜单其核心理念几乎都是 Outcome-based Metrics (结果导向指标),无法刻画模型在沙盒环境下的输出过程,更不用说复杂现实场景的真实交互体验,最终导致了评估和真实使用场景的错位。Minimax 引入了 OctoCodingBench,下一代 Coding Agent 的训练引入 Process Supervision(过程监督)。公司从 Check-level 准确率(CSR)、 Instance-level 成功率(ISR)两个维度来进行评估,旨在充分观测模型的完成任务时出现的过程指令不遵循问题,以尽可能接近真实用户体验。其中,CSR 用来衡量CodingAgent 遵循了多大比例的规则,ISR 则用来衡量 Coding Agent 是否遵循了每条规则。当期模型的Check-level 准确率(CSR)可以达到 80%+,但 Instance-level 成功率(ISR)只有10%-30%。换句话说,模型在单项约束上表现不错,但一旦要求“全部规则同时满足”,成功率就断崖式下跌。Coding Agent的“过程规范遵循”尚未被业界充分关注和优化,目前的模型严重偏科于“结果正确”,而忽视了“过程正确”。 根据 Minimax 测试榜单,开源模型已经展现出了 Agent 在过程合规展现极强的竞争力。MiniMaxM2.1和DeepSeek V3.2 的 ISR 分别达到了 26.1%和 26%,已经超过了公认强大的闭源模型Claude 4.5Sonnet(22.8%) 和 Gemini 3 Pro (22.9%)。

MiniMax:全球化的大模型公司,高效运营是特色

MiniMax 成立于 2021 年底,是全球化的通用人工智能科技公司。目前,通过技术创新、高效运营、全球化布局三大核心优势,公司已累计为超过 200 个国家及地区的超 2.12 亿名个人用户,以及超过100个国家及地区的 10 万余名企业客户以及开发者提供服务。 技术创新:MiniMax 是国内拥有三模态大模型的公司。1)大语言模型:25 年12 月底更新的M2.1在M2基础上再做提升,根据 minimax 官方评测集,多语言场景已超过 Claude Sonnet 4.5 和Gemini 3Pro,并接近 Claude Opus 4.5;2)视频生成模型:Haluo2.3 进一步提升动态表现力;3)语音和音乐生成模型:拟人效果强,Speech2.6 端到端延迟低于 250 毫秒,达到行业顶尖水平,Music02 生成单首时长可达5min,表达再升级。 高效运营:MiniMax 实现 AI 行业的“高增长、低投入、快变现”的高难度三角。1)低投入:公司累计研发投入约 4.5 亿美元;2)高增长:公司毛利率 24 年已转正,用户倍数级增长;3)快变现:收入主要来自 AI 原生产品、开放平台及其他基于 AI 的企业服务两大板块构建的订阅服务+云端API 结构,根据招股书,公司应收账款回款速度约为 38 天,高于行业平均水平。

产品驱动型公司,拥有多款 AI 造血能力产品。公司从 2023 年开始在自研大模型基础上重点打造C端AI产品矩阵,开放全模态 API 平台实现 B 端起步后,先后上线全模态交互平台Talkie/星野、视频生成平台海螺 AI、音频生成工具 MiniMax 语音与智能 Agent 应用程序 MiniMax,加速双端业务商业化规模。

公司治理:创始人具有商汤系背景,研发团队年轻化,阿里巴巴、米哈游、IDG 资本、腾讯为股东股东

结构:创始团队控股 28%,阿里巴巴、米哈游、IDG 资本、腾讯为股东。创始人闫俊杰团队通过个人与 Alpha EXP 等平台持有 28.25%股份。阿里巴巴为第一大外部机构股东。阿里巴巴、米哈游、IDG资本、腾讯为主要战略/财务投资方,分别持股比例 13.66%、6.4%、2.8%、2.58%。

管理层组成:公司上市后,董事会由 4 名执行董事、2 名非执行董事、3 名独立非执行董事组成。MiniMax的创始人是前商汤科技副总裁、研究院副院长及智慧城市事业群 CTO 闫俊杰。公司采用“极简高效”的运营模式,小团队干大事。CEO 之下最多仅设 3 层管理架构,以项目为导向精简流程,在算力成本高企的行业背景下,跑出了超高投入产出比。整体团队具备年轻化、产业绑定、效率导向的三大特点。公司 25M9 员工数量为 385 名,其中团队人员研发背景占比 74%。研究与开发团队的平均年龄不足 30 岁。 公司具有前瞻性战略眼光。根据 36 氪,在全行业死磕模型参数和性能的 2023 年,MiniMax 已经有一款成绩在海外相当亮眼的 AI 应用,Talkie;2024 年 1 月,MoE(混合专家)架构还远未成为技术主流,MiniMax又推出了国内首款 MoE 大模型 abab 6。2024Q2,多模态又成了 MiniMax 布局的重点。当前Minimax无论是语音模型 Speech 系列,还是视频生成模型“海螺 AI”,在国内外的口碑和用户数,都位于第一梯队。

模型优势:多模态模型能力,模型推理成本低、效率和可扩展性强

模型创新:MoE 架构和线性注意力机制。1)MiniMax 是亚洲首家及全球首批实现MoE 基础模型架构商业化的公司,这种结构性优势提升了可扩展性和效率,并直接转化为更少的计算需求及更低的推理成本。2)线性注意力机制:首发大规模“线性注意力”机制。这一创新使公司模型在长文本处理方面表现尤其出色,进一步提升模型效率与可扩展性,亦助力开发更强大的 AI agent。

大模型能力:拥有大语言、视频、音频方向大模型,AI 视频和 AI 音频是全球第一梯队。①AI 视频:双模式切换,扩大覆盖场景。MiniMax Hailuo 2.3 核心定位为高精度动态表现、低成本规模化创作,支持 768P/1080P 分辨率、6-10 秒时长输出,同步推出 Fast 版本优化批量生产效率,适配电商广告、短视频创作等场景,关注中短时长视频生成赛道。双模式切换,扩大覆盖场景。Hailuo2.3首创了双版本策略,Hailuo2.3 主打极致视觉保真度,适配品牌宣传、短片预告等对画面质量要求极高的场景;Hailuo2.3Fast 生成速度提升 3 倍,成本降低 60%,专门为社交媒体、营销素材等需要快速生成的场景设计。截至 26/1/3,Artificial Analysis 文生视频榜单中排行第九,图生视频榜单中排行第五。②AI 语音:Speech-02 具有超拟人效果。MiniMax 的语音生成模型 Speech 系列与音乐生成模型Music分别以实时语音交互的低延迟标杆、中文友好的全场景音乐生成工具为定位。截至26/1/3,Artificial Analysis全球语音榜单中排行第二。Speech-02 模型能够精细化逼真模仿人类语言特征和情感。Speech-02模型的核心创新在于可学习说话人的编码器,无需转录即可从参考音频中提取音色特征,使MiniMax-Speech能够生成音色与参考声高度一致且富有表现力的语音。此外,Flow-VAE 技术提升了合成音频的整体质量。这些技术使 Speech-02 语音合成精细化,逼真地模仿人类语音。 ③AI 语言:M 系列聚焦高效编码与智能体协作场景。Minimax M 系列是面向全球开发者与企业的开源大语言模型,核心聚焦高效编码与智能体协作场景,依托 MoE 架构与交错思维推理框架,实现性能、成本与部署灵活性的平衡,服务于全栈开发、多智能体协同等领域。轻量化架构设计:精准平衡性能与效率。M1以 456B 总参激活 45.9B 参数,将推理计算成本压缩至 Deepseek R1 的 25%。相较于GPT-4 高延迟、高Token成本的稠密架构与 LLaMA 2 内存占用高的全参激活模式,新上线的 M2.1 较M2 响应速度提升30%、Token消耗降低 25%,接近实现实时交互标准。根据财联社,MiniMax 提出的 CISPO 算法,其收敛性能比字节跳动近期提出的 DAPO 算法快一倍,也优于 DeepSeek 早期使用的 GRPO 算法,这使得M1 模型的整个强化学习阶段仅使用了 512 块英伟达 H800 GPU,耗时三周,成本为 53.5 万美元。根据财联社,MiniMax 表示,这一成本“比最初的预期少了一个数量级”。

产品情况:AI 陪伴产品受到欧美喜爱,25 年 AI 视频兴起,开放平台具有多模态能力、质价比突出

原生 AI 产品 1:海螺 AI 视频性价比高,适合高频测试与批量生产。海螺 AI 定位“口袋里的好莱坞片场”,以文生视频、图生视频为核心,支持 768P-1080P 高清输出,最长生成 10 秒视频,凭借多功能、低定价。核心优势:场景模板丰富,性价比高,适合高频测试与批量生产。1)相比可灵AI 侧重动作流畅度,Sora2发挥 AI 效能,海螺 AI 提供各种场景模版,追求节庆、风格等泛场景覆盖;2)相比于Sora2 年度订阅每月 14/35/70 美元的三阶段定价和可灵 AI 连续包月每月 58/234/586/1149 元的四阶段定价,海螺AI设置5类套餐,价格从 42 元/月到 1399 元/月,提供不同人群的性价比选择,并且899/1399 元/月会员可以无限生成视频。每秒价格来看,根据各家官网 VIP 价格测算,当前谷歌 Veo3 每秒视频价格0.4 美元(25年9月降价),可灵 2.5 每秒视频价格 0.2 元(25 年 9 月降价),Minimax 每秒视频价格0.1 元。

原生 AI 产品 2:Talkie/星野是 AI 陪伴产品,更具人味。海外版 Talkie 与国内版星野是AI 陪伴产品,专注于实时人机交互体验。支持用户与具备记忆、情绪及动态个性的虚拟场景和角色进行共创、定制及互动。除了自由聊天外,用户还可以与智能体互动,参与脚本式或主题式的“故事”,这些故事是半引导式叙事。故事可以由用户创作,也可以取材于热门的模板,支持结构化叙事和开放式对话。根据灼识咨询的数据,截至 25M9,Talkie╱星野在全球大模型应用中平均每日使用时间排名前五,用户每天平均花费超过70 分钟。以强情感链接、多模态互动打破赛道同质化:Talkie 角色塑造要求高更人性,沉浸感强。竞品Character AI 上,用户只需输入一句问候语就能生成角色,后续还能随时调整性格设定。而Talkie要求用户必须填写角色的背景、性格、社会关系,甚至预设特殊对话的情绪反应。比如会抱怨和发牢骚,并且具有随机惊喜性。用户沉没成本更高,情感粘性显著优于仅需简单问候语即可生成角色的竞品。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至