计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf

  • 上传者:荣*****
  • 时间:2025/09/15
  • 热度:188
  • 0人点赞
  • 举报

计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展。

Tokens:模型定价的主要单位,与收入同步高增

Tokens 是大语言模型用来切割自然语言文本的基本单位,本质反映大语言模型计算量。在推理过程中,token是计算的基本单位,模型对每个token的处理都需要消耗计算资源,处理的token数量越多,计算量会呈平方级增长。

OpenAI、Anthropic、字节跳动等基模厂商的主流商业模式包括C端订阅/付费/间接和B端行业客户/API调用。同时,tokens是模型变现中的最小单位,厂商主要围绕tokens定价。

模型厂商以tokens为主要定价单位的底层逻辑是算力投入,模型调用时的tokens消耗量与相应算力投入存在强关联性。

模型厂商营收正与其tokens调用量呈现显著同步的高增趋势,特别是对于OpenAI、Anthropic,因为其商业模式为典型的C端订阅/付费和B端行业客户/API调用,收入与tokens调用量关系紧密。

Tokens调用量应用端拆解:B+C双端

今年来,受C端AI原生应用/AI功能等用户基础扩张及B端行业客户加速渗透驱动,Google、字节跳动、OpenAI等海内外头部模型厂商日均Tokens调用量持续增长。

拆解来看:

C端驱动:包括原C端产品内部的附加AI功能、聊天助手、新兴应用(图像、视频、陪伴、办公、教育赛道);

B端驱动:包括行业企业客户、直接API调用。

展望:技术迭代解锁应用需求,算力投入加大模型厂预期乐观

大模型的技术迭代方向为推理增强+多模态+Agent化+长上下文,这样的技术迭代趋势将增强AI在更复杂、更具备“生产力”的关键场景下的实用性、准确性,使得AI应用加速落地,并且带来存量场景和增量场景的tokens增长空间。

存量:“推理增强”将模型的一次性回答拆解为多步并进行多次调用;“多模态”需增加对图片、语音、视频等的编码解码;“Agent化”会在模型生成的过程中引入工具链;“长上下文”使得大型文档/项目可被全量处理而无需截断。

增量:大量原本因“不准、不全、不落地”而被搁置的需求有望被解锁。当准确率、可控性跨过可行性线后,用户特别是B端企业(有生产力场景需求)或将从观望转为批量采购。

使用成本侧,模型厂进行了算力成本优化、多价格策略的尝试以压降大模型使用成本,企业/个人模型调用ROI得以提高。

1页 / 共30
计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第1页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第2页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第3页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第4页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第5页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第6页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第7页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第8页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第9页 计算机行业大模型及AI应用专题报告:从Tokens角度跟踪AI应用落地进展.pdf第10页
  • 格式:pdf
  • 大小:2.7M
  • 页数:30
  • 价格: 5积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至