2026年计算机行业GenAI系列（二十七）：Token高速增长的背后，应用突破，与算力同享加速发展机会

来源：广发证券
发布时间：2026/03/02
浏览次数：88
举报

相关深度报告REPORTS

计算机行业GenAI系列（二十七）：Token高速增长的背后，应用突破，与算力同享加速发展机会.pdf

计算机行业GenAI系列（二十七）：Token高速增长的背后，应用突破，与算力同享加速发展机会。根据OpenRouter平台数据显示，2026年2月16日—2月22日，该平台上中国AI大模型周度Tokens调用量为5.16万亿，首次超过美国AI大模型Tokens调用量2.7万亿，标志着国产大模型正处于由“技术追赶”向“应用落地”转变的关键阶段，并已取得阶段性成果，这一结果是模型能力、应用场景、商业生态多重因素共同作用的结果。国产大模型性能已跻身全球第一梯队，GLM-5、Qwen3.5、MiniMaxM2.5等模型在编程、多模态、长上下...

中国 AI 大模型周度 Tokens 调用量超过美国

根据OpenRouter平台数据显示，2026年2月16日—2月22日，该平台上中国AI大模型周度Tokens调用量首次超越美国，实现阶段性突破。2月16日—2月22日，平台内国产模型Token调用量进一步冲高至5.16万亿，三周内大涨127%；同期美国模型在该平台的调用量回落至2.7万亿Token。Token调用量是衡量AI模型使用强度与商业价值的核心指标，这一快速增长主要得益于MiniMax2.5、GLM-5等国产模型在编码、智能体及多模态能力上的持续提升。

国内方面，国内企业级大模型调用市场呈现明显的头部集中趋势，千问大模型在企业级应用场景的日均调用量于2025年下半年实现显著涨幅，成为拉动市场集中度提升的核心动力。根据国际市场调研机构沙利文的数据显示，2025年下半年中国企业级大模型日均总消耗量已达37万亿Tokens，较2025H1的10.2万亿Tokens增长263%。从2025年上半年到下半年，阿里通义（千问）、字节豆包、DeepSeek三大头部模型的日均调用占比由合计42.1%提升至71.8%，行业集中度显著增强。其中，千问大模型增长最为突出，占比从25年上半年的17.7%大幅攀升至25年下半年的32.1%，与第二名豆包的差距由25年上半年的3.6%拉升至25年下半年的10.8%，位居行业首位。

海外方面，尽管OpenAI仍维持日均访问量的绝对领先，但其市场份额正被Google Gemini持续追赶。根据SimilarWeb的数据，2026年1月，全球主流AI大模型网页访问量阶段性回落，主要受年初季节性假期、学期更迭及企业年度预算收紧等因素影响。随着市场竞争不断加剧，Google Gemini凭借密集产品迭代，市场份额有所提升。 2025年7月Gemini 2.5 Flash-Lite发布，10月推出强化用户深度创作控制权的Veo 3.1， 11月Gemini 3 Pro与Nano Banana Pro相继推出，Google依托高性能大模型与多模态创作能力的协同发力，实现用户量和访问量的快速增长，持续提升其市场份额。

总体而言，2026年以来，中国AI大模型Tokens调用量快速攀升并反超美国，核心源于成本优势、场景落地、爆款应用的合力驱动：（1）中国AI大模型的性价比优势：中国AI大模型依托 MoE 架构与高效推理优化，在性能接近国际一线水平的同时，API调用价格较美国AI大模型更低。在性价比优势突出的情况下，推动各行业开发者和企业用户的快速使用。（2）国内企业场景加速落地：企业智能体、多模态客服、内容生成等高频任务推高单次Token消耗。尤其是AI辅助编程工具（如 Trae、通义灵码、EazyDevelop）在企业开发中普及，代码生成、调试与重构需求激增，进一步推动Tokens的消耗。（3）文生视频爆款应用的出圈：2026 年初，Seedance 2.0作为现象级多模态生成应用爆火，其文生视频、AI 创作、虚拟人互动等功能带来海量高 Token 消耗的生成类请求。该应用不仅在国内登顶下载榜，更在海外快速破圈，直接拉动中国大模型调用量陡峭跃升，成为短期增速冲高的关键变量。

国产 AI 大模型性能提升较快，性价比优势明显

国产模型全面跻身全球第一梯队，开源领域优势显著。2026年2月，智谱、MiniMax 和阿里巴巴分别推出了GLM-5、M2.5和Qwen-3.5大模型。模型能力均有较大提升。根据Artificial Analysis的主流大模型智能水平评测数据，截至2026年2月27 日，Claude Sonnet 4.6以52分位居前列，代表闭源模型顶尖水准；GLM-5以50 分成为开源阵营绝对标杆，印证其编程与Agent能力的领先表现；Qwen3.5以45 分排名第十一，凭借原生多模态与高效架构展现强劲实力；MiniMax M2.5以42 分紧随其后，在编程与工具调用场景的核心能力同样突出。整体而言，国产模型（GLM-5、Qwen3.5、MiniMax M2.5等）已全面跻身全球第一梯队，与闭源头部模型差距持续收窄，开源领域优势显著。

模型调用量分化显著，国产模型凭性能与成本优势快速抢占全球开发者市场份额。从OpenRouter平台的周度调用量数据看，截止2026年2月27日，MiniMax M2.5位居榜首，其优异工作性价比与较强的Agent能力成为开发者首选；GLM-5位列第五，综合性能在全球开源模型中表现亮眼，持续受到市场认可；Claude Sonnet 4.6位列第八，凭借其在安全与长文本场景的优势，在专业领域保持着稳定的用户基础； Qwen3.5虽未直接进入前十，但其生产版本Qwen3.5-Flash凭借每百万Token 0.2元的成本优势，有望在国内市场快速起量，展现出强劲的增长潜力。

GLM-5逆势提价，其余三家延续降价趋势，这是国内AI大模型由价格内卷转向技术定价的重要信号。从API定价对比来看，Anthropic Claude系列整体定价最高， Opus、Sonnet、Haiku分别处于高端、中端、轻量化价位；智谱GLM-5随能力升级上调输入/输出价至4/18元，较GLM-4.7的2/8元大幅提升，同时高于MiniMaxM2.5、Qwen3.5-Plus等国内大模型定价，体现其技术溢价。GLM-5仍显著低于 Claude系列大模型；Claude Opus 4.6的输入/输出价分别为5/25美元；MiniMax M2系列定价保持稳定；阿里Qwen3.5系列性价比突出，价格显著低于行业水平，进一步巩固其模型成本优势。

GLM Coding Plan迎来首次价格上调，核心套餐涨幅达30%。2026年2月12日，GLM5模型发布同日，智谱宣布GLM Coding Plan整体价格上调。此次调价后，GLM Coding Lite、Pro、Max套餐原价分别调整为49元/月、149元/月、469元/月，首月特惠价同步取消“五折”优惠，改为按原价基础小幅让利。此外，Pro与Max套餐限量加赠Auto-GLM-OpenClaw 1个月等权益，以技术与服务升级承接价格调整，进一步巩固其在AI编码订阅市场的竞争力。

GLM-5自发布以来，凭借在长逻辑推理、编程与智能体工程化方面的核心优势，已快速实现多场景商业化落地。在游戏领域，与青干游戏工作室联合开发的《历史模拟器：崇祯》中，GLM-5作为底层引擎支撑千万级Token长周期推演，内测次日留存率达78.6%，验证了AI原生游戏的商业化潜力；在办公领域，深度接入金山办公WPS 灵犀，通过可审计的表格智能体与工程级PPT智能体，推动办公产品向“专业交付” 升级；同时，TRAE、Qoder、美团CatPaw、快手万擎、扣子、百度智能云等10余家行业头部产品已完成官方接入，覆盖多元场景，形成了“标杆案例+生态接入”的商业化格局。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）