2026年MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力

来源：国信证券
发布时间：2026/02/14
浏览次数：124
举报

相关深度报告REPORTS

MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力.pdf

MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力。事项：近期，开源项目Clawdbot在技术社区引发了关注。项目上线初期，MiniMax即接入其技术生态，为开发者提供模型能力层面的支持。国信互联网观点：Minimaxagent能力突出，凭借质价比受到海外开发者好评。开源项目Clawdbot（现已经更名openClaw）在技术社区爆火，Minimax提供底层技术支持。作为一款主力模型，MiniMax2.1在工具调用方面表现出色。更重要的是，在处理此类非极端复杂的全栈任务时，M2.1高效且成本低。相较于Claude等同类型产品，M2.1API与CodingPlan套...

开源项目 Clawdbot（现已经更名 openClaw）在技术社区爆火，Minimax 提供底层技术支持。Clawdbot最初在 GitHub 发酵，短短几天星标数突破 10 万。Clawdbot 项目由创建，于 2025 年底上线。项目上线初期，MiniMax 即接入其技术生态，为开发者提供模型能力层面的支持。作为一款开源、可自行托管的AI助手，Clawdbot 可以在本地计算机上运行，兼容 MacOS、Windows 或 Linux 等多种系统，并可以接入常用聊天工具，如 WhatsApp、Telegram、Discord、Slack、Signal 或 iMessage 等，也可以直接连接GitHub、Vercel、Google Drive 等生产力工具。除内置了多种 Agent 常用的工具外，还可以通过插件和Skills扩展更多能力。在后续的实践案例中，开发者们也选择将 MiniMax 2.1 作为核心引擎来使用Clawdbot，作为自己的日常工作流。 Minimax agent 质价比突出，Clawdbot 火爆后 token 调用量快速提升。作为一款主力模型，MiniMax2.1在工具调用方面表现非常出色。更重要的是，在处理此类非极端复杂的全栈任务时，M2.1 高效且成本低廉，实现了以极低的边际成本撬动巨大的生产力杠杆。相较于 Claude 等同类型产品，M2.1 API 与CodingPlan 套餐的高性价比、大用量及任务处理高效深受用户好评，满足 24*7 小时持续运行。根据Openrouter，Clawdbot 火爆后 token 调用量快速提升，截止 2026/2/8，周度 token 环比调用量同比提升64%。

Minimax 开源新评测集，定义 Coding Agent 的生产级标准

Agent 模型忽视过程正确导致不遵循明确指示。根据 Minimax 公众号文章，在Coding Agent 的实际应用中，公司观察到一个反复出现，却常被忽略的的现象：Agent 不遵循明确给出的指令。当前的学术榜单其核心理念几乎都是 Outcome-based Metrics (结果导向指标)，无法刻画模型在沙盒环境下的输出过程，更不用说复杂现实场景的真实交互体验，最终导致了评估和真实使用场景的错位。Minimax 引入了 OctoCodingBench，下一代 Coding Agent 的训练引入 Process Supervision(过程监督)。公司从 Check-level 准确率(CSR)、 Instance-level 成功率(ISR)两个维度来进行评估，旨在充分观测模型的完成任务时出现的过程指令不遵循问题，以尽可能接近真实用户体验。其中，CSR 用来衡量CodingAgent 遵循了多大比例的规则，ISR 则用来衡量 Coding Agent 是否遵循了每条规则。当期模型的Check-level 准确率(CSR)可以达到 80%+，但 Instance-level 成功率(ISR)只有10%-30%。换句话说，模型在单项约束上表现不错，但一旦要求“全部规则同时满足”，成功率就断崖式下跌。Coding Agent的“过程规范遵循”尚未被业界充分关注和优化，目前的模型严重偏科于“结果正确”，而忽视了“过程正确”。根据 Minimax 测试榜单，开源模型已经展现出了 Agent 在过程合规展现极强的竞争力。MiniMaxM2.1和DeepSeek V3.2 的 ISR 分别达到了 26.1%和 26%，已经超过了公认强大的闭源模型Claude 4.5Sonnet(22.8%) 和 Gemini 3 Pro (22.9%）。

MiniMax：全球化的大模型公司，高效运营是特色

MiniMax 成立于 2021 年底，是全球化的通用人工智能科技公司。目前，通过技术创新、高效运营、全球化布局三大核心优势，公司已累计为超过 200 个国家及地区的超 2.12 亿名个人用户，以及超过100个国家及地区的 10 万余名企业客户以及开发者提供服务。技术创新：MiniMax 是国内拥有三模态大模型的公司。1）大语言模型：25 年12 月底更新的M2.1在M2基础上再做提升，根据 minimax 官方评测集，多语言场景已超过 Claude Sonnet 4.5 和Gemini 3Pro，并接近 Claude Opus 4.5；2）视频生成模型：Haluo2.3 进一步提升动态表现力；3）语音和音乐生成模型：拟人效果强，Speech2.6 端到端延迟低于 250 毫秒，达到行业顶尖水平，Music02 生成单首时长可达5min，表达再升级。高效运营：MiniMax 实现 AI 行业的“高增长、低投入、快变现”的高难度三角。1）低投入：公司累计研发投入约 4.5 亿美元；2）高增长：公司毛利率 24 年已转正，用户倍数级增长；3）快变现：收入主要来自 AI 原生产品、开放平台及其他基于 AI 的企业服务两大板块构建的订阅服务+云端API 结构，根据招股书，公司应收账款回款速度约为 38 天，高于行业平均水平。

产品驱动型公司，拥有多款 AI 造血能力产品。公司从 2023 年开始在自研大模型基础上重点打造C端AI产品矩阵，开放全模态 API 平台实现 B 端起步后，先后上线全模态交互平台Talkie/星野、视频生成平台海螺 AI、音频生成工具 MiniMax 语音与智能 Agent 应用程序 MiniMax，加速双端业务商业化规模。

公司治理：创始人具有商汤系背景，研发团队年轻化，阿里巴巴、米哈游、IDG 资本、腾讯为股东股东

结构：创始团队控股 28%，阿里巴巴、米哈游、IDG 资本、腾讯为股东。创始人闫俊杰团队通过个人与 Alpha EXP 等平台持有 28.25%股份。阿里巴巴为第一大外部机构股东。阿里巴巴、米哈游、IDG资本、腾讯为主要战略/财务投资方，分别持股比例 13.66%、6.4%、2.8%、2.58%。

管理层组成：公司上市后，董事会由 4 名执行董事、2 名非执行董事、3 名独立非执行董事组成。MiniMax的创始人是前商汤科技副总裁、研究院副院长及智慧城市事业群 CTO 闫俊杰。公司采用“极简高效”的运营模式，小团队干大事。CEO 之下最多仅设 3 层管理架构，以项目为导向精简流程，在算力成本高企的行业背景下，跑出了超高投入产出比。整体团队具备年轻化、产业绑定、效率导向的三大特点。公司 25M9 员工数量为 385 名，其中团队人员研发背景占比 74%。研究与开发团队的平均年龄不足 30 岁。公司具有前瞻性战略眼光。根据 36 氪，在全行业死磕模型参数和性能的 2023 年，MiniMax 已经有一款成绩在海外相当亮眼的 AI 应用，Talkie；2024 年 1 月，MoE（混合专家）架构还远未成为技术主流，MiniMax又推出了国内首款 MoE 大模型 abab 6。2024Q2，多模态又成了 MiniMax 布局的重点。当前Minimax无论是语音模型 Speech 系列，还是视频生成模型“海螺 AI”，在国内外的口碑和用户数，都位于第一梯队。

模型优势：多模态模型能力，模型推理成本低、效率和可扩展性强

模型创新：MoE 架构和线性注意力机制。1）MiniMax 是亚洲首家及全球首批实现MoE 基础模型架构商业化的公司，这种结构性优势提升了可扩展性和效率，并直接转化为更少的计算需求及更低的推理成本。2）线性注意力机制：首发大规模“线性注意力”机制。这一创新使公司模型在长文本处理方面表现尤其出色，进一步提升模型效率与可扩展性，亦助力开发更强大的 AI agent。

大模型能力：拥有大语言、视频、音频方向大模型，AI 视频和 AI 音频是全球第一梯队。①AI 视频：双模式切换，扩大覆盖场景。MiniMax Hailuo 2.3 核心定位为高精度动态表现、低成本规模化创作，支持 768P/1080P 分辨率、6-10 秒时长输出，同步推出 Fast 版本优化批量生产效率，适配电商广告、短视频创作等场景，关注中短时长视频生成赛道。双模式切换，扩大覆盖场景。Hailuo2.3首创了双版本策略，Hailuo2.3 主打极致视觉保真度，适配品牌宣传、短片预告等对画面质量要求极高的场景；Hailuo2.3Fast 生成速度提升 3 倍，成本降低 60%，专门为社交媒体、营销素材等需要快速生成的场景设计。截至 26/1/3，Artificial Analysis 文生视频榜单中排行第九，图生视频榜单中排行第五。②AI 语音：Speech-02 具有超拟人效果。MiniMax 的语音生成模型 Speech 系列与音乐生成模型Music分别以实时语音交互的低延迟标杆、中文友好的全场景音乐生成工具为定位。截至26/1/3，Artificial Analysis全球语音榜单中排行第二。Speech-02 模型能够精细化逼真模仿人类语言特征和情感。Speech-02模型的核心创新在于可学习说话人的编码器，无需转录即可从参考音频中提取音色特征，使MiniMax-Speech能够生成音色与参考声高度一致且富有表现力的语音。此外，Flow-VAE 技术提升了合成音频的整体质量。这些技术使 Speech-02 语音合成精细化，逼真地模仿人类语音。 ③AI 语言：M 系列聚焦高效编码与智能体协作场景。Minimax M 系列是面向全球开发者与企业的开源大语言模型，核心聚焦高效编码与智能体协作场景，依托 MoE 架构与交错思维推理框架，实现性能、成本与部署灵活性的平衡，服务于全栈开发、多智能体协同等领域。轻量化架构设计：精准平衡性能与效率。M1以 456B 总参激活 45.9B 参数，将推理计算成本压缩至 Deepseek R1 的 25%。相较于GPT-4 高延迟、高Token成本的稠密架构与 LLaMA 2 内存占用高的全参激活模式，新上线的 M2.1 较M2 响应速度提升30%、Token消耗降低 25%，接近实现实时交互标准。根据财联社，MiniMax 提出的 CISPO 算法，其收敛性能比字节跳动近期提出的 DAPO 算法快一倍，也优于 DeepSeek 早期使用的 GRPO 算法，这使得M1 模型的整个强化学习阶段仅使用了 512 块英伟达 H800 GPU，耗时三周，成本为 53.5 万美元。根据财联社，MiniMax 表示，这一成本“比最初的预期少了一个数量级”。

产品情况：AI 陪伴产品受到欧美喜爱，25 年 AI 视频兴起，开放平台具有多模态能力、质价比突出

原生 AI 产品 1：海螺 AI 视频性价比高，适合高频测试与批量生产。海螺 AI 定位“口袋里的好莱坞片场”，以文生视频、图生视频为核心，支持 768P-1080P 高清输出，最长生成 10 秒视频，凭借多功能、低定价。核心优势：场景模板丰富，性价比高，适合高频测试与批量生产。1）相比可灵AI 侧重动作流畅度，Sora2发挥 AI 效能，海螺 AI 提供各种场景模版，追求节庆、风格等泛场景覆盖；2）相比于Sora2 年度订阅每月 14/35/70 美元的三阶段定价和可灵 AI 连续包月每月 58/234/586/1149 元的四阶段定价，海螺AI设置5类套餐，价格从 42 元/月到 1399 元/月，提供不同人群的性价比选择，并且899/1399 元/月会员可以无限生成视频。每秒价格来看，根据各家官网 VIP 价格测算，当前谷歌 Veo3 每秒视频价格0.4 美元（25年9月降价），可灵 2.5 每秒视频价格 0.2 元（25 年 9 月降价），Minimax 每秒视频价格0.1 元。

原生 AI 产品 2：Talkie/星野是 AI 陪伴产品，更具人味。海外版 Talkie 与国内版星野是AI 陪伴产品，专注于实时人机交互体验。支持用户与具备记忆、情绪及动态个性的虚拟场景和角色进行共创、定制及互动。除了自由聊天外，用户还可以与智能体互动，参与脚本式或主题式的“故事”，这些故事是半引导式叙事。故事可以由用户创作，也可以取材于热门的模板，支持结构化叙事和开放式对话。根据灼识咨询的数据，截至 25M9，Talkie╱星野在全球大模型应用中平均每日使用时间排名前五，用户每天平均花费超过70 分钟。以强情感链接、多模态互动打破赛道同质化：Talkie 角色塑造要求高更人性，沉浸感强。竞品Character AI 上，用户只需输入一句问候语就能生成角色，后续还能随时调整性格设定。而Talkie要求用户必须填写角色的背景、性格、社会关系，甚至预设特殊对话的情绪反应。比如会抱怨和发牢骚，并且具有随机惊喜性。用户沉没成本更高，情感粘性显著优于仅需简单问候语即可生成角色的竞品。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

2026年MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力

MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力.pdf

评论：