科技行业深度研究:多模态大模型和应用奇点将至.pdf

  • 上传者:罗***
  • 时间:2025/07/10
  • 热度:304
  • 0人点赞
  • 举报

科技行业深度研究:多模态大模型和应用奇点将至。我们认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术 进步方面:原生多模态模型架构得到业界认可,OpenAI 和 Google 的原生 多模态模型已经在性能、延时、部署上展现出了优势。2)商业化进展方面: 全球维度看,除了最头部的 OpenAI 和 Anthropic 依靠模型“智能”实现商 业化,相当一部分 AI 应用公司的商业化产品依赖多模态能力。国内维度看, 国内公司在视频生成赛道已经实现了较成熟的全球化和商业化之路。与市场 不同的观点在于,1)更早认识到原生多模态架构将成为主流;2)AI 商业 化不能仅聚焦在二级公司,更要关注全球维度一级公司的进展。

多模态是大语言模型(LLM)发展的必然趋势

借助 Scaling Law 和强化学习,LLM 已经在很多领域获得了超过普通人类的 智能,但是其处理的核心信息仅是文本。为了拓展更广泛的使用场景,研究 者将其他模态的能力“加入”到 LLM 中,多模态大型语言模型(MLLM)问 世。架构上看,MLLM 可以分为模块化架构和原生架构,前者通常分别训练 不同模态然后实现模块“拼接”,而后者则直接在全部模态数据上从头开始 同步训练的模型。效果上看,原生 MLLM 在性能、延时、部署上均有优势, 但是对算力和 Know-How 的需求较高,通常只有头部模型大厂在做,OpenAI 和 Google 领先。无论架构如何,MLLM 已经成为行业共识的必然趋势。

从大模型到多模态:商业化的必由之路

从全球 AI 公司的商业化进展看,无论是基于 LLM 的文本类产品,还是基于 MLLM 的多模态产品,呈现出以下大趋势:1)海外商业化进展快于国内。2) 全球维度,一级公司进展快于二级。3)整体多模态为主的产品商业化快于 文本产品。4)Chatbot 为代表的文本类产品国内外商业化分歧明显,据非 凡产研数据,截至 25 年 5 月,在海外能够实现 10 亿美金以上的 ARR(如 OpenAI、Anthropic),而国内 Chatbot 还未实现很好的商业化。国内 AI 产品年化收入超过 1 亿美金的有 3 家公司,分别为美图(1357 HK)、快手 (1024 HK)和睿琪软件(非上市),其 AI 产品均为多模态产品。

国内的视频生成是全球化、商业化最成熟的 AI 应用赛道

主流的多模态产品,大致分为图像生成、视频生成和其他多模态交互三类。 其中,国内厂商在视频生成赛道的全球化和商业化最成熟。1)模型/产品成 熟:据 Artificial Analysis 数据,在文生视频、图生视频排行榜单上,字节 Seedance 1.0 均为 Top 1,快手可灵(Kling)、MiniMax Hailuo 02 名列前 茅。2)商业化成熟:以快手可灵为典型的代表,上线 9 个月累计收入超 1 亿人民币,25Q1(上线 10 个月左右)ARR 突破 1 亿美金大关。可灵的成 功,或意味着国内视频生成领域商业化单点突破到多点突破的开始。

1页 / 共38
科技行业深度研究:多模态大模型和应用奇点将至.pdf第1页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第2页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第3页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第4页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第5页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第6页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第7页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第8页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第9页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第10页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第11页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第12页 科技行业深度研究:多模态大模型和应用奇点将至.pdf第13页
  • 格式:pdf
  • 大小:3.3M
  • 页数:38
  • 价格: 6积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至