2026年计算机行业GenAI系列(二十七):Token高速增长的背后,应用突破,与算力同享加速发展机会

  • 来源:广发证券
  • 发布时间:2026/03/02
  • 浏览次数:88
  • 举报
相关深度报告REPORTS

计算机行业GenAI系列(二十七):Token高速增长的背后,应用突破,与算力同享加速发展机会.pdf

计算机行业GenAI系列(二十七):Token高速增长的背后,应用突破,与算力同享加速发展机会。根据OpenRouter平台数据显示,2026年2月16日—2月22日,该平台上中国AI大模型周度Tokens调用量为5.16万亿,首次超过美国AI大模型Tokens调用量2.7万亿,标志着国产大模型正处于由“技术追赶”向“应用落地”转变的关键阶段,并已取得阶段性成果,这一结果是模型能力、应用场景、商业生态多重因素共同作用的结果。国产大模型性能已跻身全球第一梯队,GLM-5、Qwen3.5、MiniMaxM2.5等模型在编程、多模态、长上下...

中国 AI 大模型周度 Tokens 调用量超过美国

根据OpenRouter平台数据显示,2026年2月16日—2月22日,该平台上中国AI大模 型周度Tokens调用量首次超越美国,实现阶段性突破。2月16日—2月22日,平台内 国产模型Token调用量进一步冲高至5.16万亿,三周内大涨127%;同期美国模型在 该平台的调用量回落至2.7万亿Token。Token调用量是衡量AI模型使用强度与商业 价值的核心指标,这一快速增长主要得益于MiniMax2.5、GLM-5等国产模型在编码、 智能体及多模态能力上的持续提升。

国内方面,国内企业级大模型调用市场呈现明显的头部集中趋势,千问大模型在企 业级应用场景的日均调用量于2025年下半年实现显著涨幅,成为拉动市场集中度提 升的核心动力。根据国际市场调研机构沙利文的数据显示,2025年下半年中国企业 级大模型日均总消耗量已达37万亿Tokens,较2025H1的10.2万亿Tokens增长263%。 从2025年上半年到下半年,阿里通义(千问)、字节豆包、DeepSeek三大头部模型 的日均调用占比由合计42.1%提升至71.8%,行业集中度显著增强。其中,千问大模 型增长最为突出,占比从25年上半年的17.7%大幅攀升至25年下半年的32.1%,与第 二名豆包的差距由25年上半年的3.6%拉升至25年下半年的10.8%,位居行业首位。

海外方面,尽管OpenAI仍维持日均访问量的绝对领先,但其市场份额正被Google Gemini持续追赶。根据SimilarWeb的数据,2026年1月,全球主流AI大模型网页访 问量阶段性回落,主要受年初季节性假期、学期更迭及企业年度预算收紧等因素影 响。随着市场竞争不断加剧,Google Gemini凭借密集产品迭代,市场份额有所提升。 2025年7月Gemini 2.5 Flash-Lite发布,10月推出强化用户深度创作控制权的Veo 3.1, 11月Gemini 3 Pro与Nano Banana Pro相继推出,Google依托高性能大模型与多模 态创作能力的协同发力,实现用户量和访问量的快速增长,持续提升其市场份额。

总体而言,2026年以来,中国AI大模型Tokens调用量快速攀升并反超美国,核心源 于成本优势、场景落地、爆款应用的合力驱动: (1)中国AI大模型的性价比优势:中国AI大模型依托 MoE 架构与高效推理优化, 在性能接近国际一线水平的同时,API调用价格较美国AI大模型更低。在性价比优势 突出的情况下,推动各行业开发者和企业用户的快速使用。 (2)国内企业场景加速落地:企业智能体、多模态客服、内容生成等高频任务推高 单次Token消耗。尤其是AI辅助编程工具(如 Trae、通义灵码、EazyDevelop)在企业开发中普及,代码生成、调试与重构需求激增,进一步推动Tokens的消耗。 (3)文生视频爆款应用的出圈:2026 年初,Seedance 2.0作为现象级多模态生成 应用爆火,其文生视频、AI 创作、虚拟人互动等功能带来海量高 Token 消耗的生 成类请求。该应用不仅在国内登顶下载榜,更在海外快速破圈,直接拉动中国大模 型调用量陡峭跃升,成为短期增速冲高的关键变量。

国产 AI 大模型性能提升较快,性价比优势明显

国产模型全面跻身全球第一梯队,开源领域优势显著。2026年2月,智谱、MiniMax 和阿里巴巴分别推出了GLM-5、M2.5和Qwen-3.5大模型。模型能力均有较大提 升。根据Artificial Analysis的主流大模型智能水平评测数据,截至2026年2月27 日,Claude Sonnet 4.6以52分位居前列,代表闭源模型顶尖水准;GLM-5以50 分成为开源阵营绝对标杆,印证其编程与Agent能力的领先表现;Qwen3.5以45 分排名第十一,凭借原生多模态与高效架构展现强劲实力;MiniMax M2.5以42 分紧随其后,在编程与工具调用场景的核心能力同样突出。整体而言,国产模型 (GLM-5、Qwen3.5、MiniMax M2.5等)已全面跻身全球第一梯队,与闭源头部 模型差距持续收窄,开源领域优势显著。

模型调用量分化显著,国产模型凭性能与成本优势快速抢占全球开发者市场份额。 从OpenRouter平台的周度调用量数据看,截止2026年2月27日,MiniMax M2.5位居 榜首,其优异工作性价比与较强的Agent能力成为开发者首选;GLM-5位列第五,综 合性能在全球开源模型中表现亮眼,持续受到市场认可;Claude Sonnet 4.6位列第 八,凭借其在安全与长文本场景的优势,在专业领域保持着稳定的用户基础; Qwen3.5虽未直接进入前十,但其生产版本Qwen3.5-Flash凭借每百万Token 0.2元 的成本优势,有望在国内市场快速起量,展现出强劲的增长潜力。

GLM-5逆势提价,其余三家延续降价趋势,这是国内AI大模型由价格内卷转向技 术定价的重要信号。从API定价对比来看,Anthropic Claude系列整体定价最高, Opus、Sonnet、Haiku分别处于高端、中端、轻量化价位;智谱GLM-5随能力升 级上调输入/输出价至4/18元,较GLM-4.7的2/8元大幅提升,同时高于MiniMaxM2.5、Qwen3.5-Plus等国内大模型定价,体现其技术溢价。GLM-5仍显著低于 Claude系列大模型;Claude Opus 4.6的输入/输出价分别为5/25美元;MiniMax M2系列定价保持稳定;阿里Qwen3.5系列性价比突出,价格显著低于行业水平, 进一步巩固其模型成本优势。

GLM Coding Plan迎来首次价格上调,核心套餐涨幅达30%。2026年2月12日,GLM5模型发布同日,智谱宣布GLM Coding Plan整体价格上调。此次调价后,GLM Coding Lite、Pro、Max套餐原价分别调整为49元/月、149元/月、469元/月,首月特 惠价同步取消“五折”优惠,改为按原价基础小幅让利。此外,Pro与Max套餐限量 加赠Auto-GLM-OpenClaw 1个月等权益,以技术与服务升级承接价格调整,进一步 巩固其在AI编码订阅市场的竞争力。

GLM-5自发布以来,凭借在长逻辑推理、编程与智能体工程化方面的核心优势,已 快速实现多场景商业化落地。在游戏领域,与青干游戏工作室联合开发的《历史模 拟器:崇祯》中,GLM-5作为底层引擎支撑千万级Token长周期推演,内测次日留存 率达78.6%,验证了AI原生游戏的商业化潜力;在办公领域,深度接入金山办公WPS 灵犀,通过可审计的表格智能体与工程级PPT智能体,推动办公产品向“专业交付” 升级;同时,TRAE、Qoder、美团CatPaw、快手万擎、扣子、百度智能云等10余家 行业头部产品已完成官方接入,覆盖多元场景,形成了“标杆案例+生态接入”的商 业化格局。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至