2025年AI应用行业系列报告:AI视频生成,商业化加速,国产厂商表现亮眼
- 来源:国元证券
- 发布时间:2025/07/01
- 浏览次数:574
- 举报
AI应用行业系列报告:AI视频生成,商业化加速,国产厂商表现亮眼.pdf
AI应用行业系列报告:AI视频生成,商业化加速,国产厂商表现亮眼。技术路径:从GAN-Transformer-DiffusionModel-DiT,技术演进推动行业进入可商用阶段:20世纪90年代以来,AI视频生成持续迭代,经历了多个关键技术的突破,经历了从静态图像序列拼接成视频流-GAN-Transformer-DiffusionModel-DiT的技术演进,生成内容丰富度以及可控性持续提升。Sora验证了Diffusion和Transformer结合的有效性,并带动DiT架构逐渐成为当前重点方向。行业进入商业化发展快轨,根据FortuneBusinessInsights预计2032年全球规...
1. 技术路径:从GAN-Transformer-Diffusion Model-DiT
技术路径探索,从图像拼接生成-GAN-Transformer-Diffusion Model-DiT:相比于图片生成视频生成更为复杂,若按帧率24 帧/秒,一条5秒的视频就百余张图像合成,同时视频生成还需要考虑时序连贯性、空间一致性等问题。20世纪90年代以来,AI 视频生成持续迭代,经历了多个关键技术的突破,经历了从静态图像序列拼接成视频流-GAN-Transformer-Diffusion ModelDiT的技术演进,生成内容丰富度以及可控性持续提升。
VAE(Variational Autoencoder 变分自编码器)于2013年由Kingma和Welling提出,2015开始被应用于视频预测任务,通过 编码器将输入数据映射到潜在空间,然后通过解码器从潜在空间生成数据。VAE生成视频内容存在模糊等问题。
GAN(Generative Adversarial Networks,对抗生成网络)于2014年由Ian Goodfellow等人提出,2016年左右开始用于视频 生成,主要由生成器(Generator)和判别器(Discriminator)两部分组成,生成器负责生成数据,判别器负责判断数据的真 实性,两者在训练过程中不断竞争,生成器学习产生越来越真实的数据,而判别器学习更好地区分真假数据,通过两者相互博 弈来实现高质量图片或是视频的生成。对抗训练提升了生成内容的质量,但存在多样性有限、训练不稳定容易出现梯度消失和 模式崩溃等问题。VAE+GAN,VAE与GAN常常结合使用,使生成的视频内容更加多样化,并改善生成视频的清晰度和真实性。 基于GAN的视频生成产品包括VideoGAN、TGAN等。
Transformer: Transformer架构于2017年由Google团队提出并逐渐应用于视频生成领域。2020年ViT论文发表,2021Google发 表了Video Vision Transformer。Transformer架构更好的建模像素点之间的上下文关系,提升视觉内容生成质量,缺点在于高 昂的成本和较慢的生成速度。代表性产品包括VideoGPT、Phenaki等。
Diffusion Model:扩散模型灵感源于热力学,由一个逐级添加高斯噪声的前向扩散过程和一个逐级预测并消除噪声的反向过 程组成。2020年Ho等人的论文《Denoising diffusion probabilistic models》(DDPM) 发表成为关键节点,2021年Latent Diffusion Models论文发表,将扩散空间从图像空间转移到潜空间(Latent Space),大幅提升计算效率。 2022年Video Diffusion Model论文发表,通过加入时序注意力层的方式将扩散模型中的二维U-Net扩展至三维,将扩算模型应用于视频生成任 务。另外,基于LDM的开源系列模型Stable Diffusion推出,进一步推动扩散模型在视觉生成领域的主导作用。
DiT:2022年12月 《Scalable Diffusion Models with Transformers 》论文发表,提出将传统扩散模型的U-Net替换为 Transformer,从而提升传统扩散模型的可扩展性。采用AdaLN-Zero(自适应归一化)注入条件信息(文本/图像/轨迹),取代 交叉注意力。2024年2月OpenAI发布Sora,验证了Diffusion和Transformer结合的有效性,并带动DiT架构成为重点方向。根据 Sora发布的技术文章,Sora模型先将视频压缩到低维潜在空间中,然后将表示分解为时空patch,从而实现了视频的“patch 化”,采用DiT架构,在多个领域展示了显著的扩展性能。同时对比过去的视频生成模型,Sora生成视频时长显著提升(60 秒),对于自然语言和物理世界规律有了更强的理解能力。
Sora为行业带来深刻启发,不少厂商跟进DiT架构,并在此之上进行创新。以可灵为例,可灵使用了DiT架构,同时对模型中的 隐空间编/解码、时序建模等模块进行了升维处理。Seedance1.0引入精确描述模型提升数据多样性与可用性,统一高效的预训 练框架实现多镜头切换与多模态输入 ,后训练构建复合奖励系统提升画面生动性、稳定性和美感。
行业围绕提升效率和可控性以及长视频生成等目标持续迭代。比如扩散模型的优化策略和模型蒸馏、扩散模型的混合专家 (MoE)架构、引入人类反馈的强化学习、分层生成等,另外除了DiT架构之外,其他几种混合架构研究也在持续推进。
2. AI视频生成行业:逐步进入可商用阶段,应用及商业化加速
全球视频内容占互联网流量的比重持续攀升预计超8成,根据Cisco的预测,2022年视频内容占互联网流量的比重预计由2017 年的75%增加至82%,而中国方面,Cisco预测2020年中国视频内容流量占比达到87%。
根据Fortune Business Insights,预计到2032年AI视频生成全球规模达到25.63亿美金,约合184亿人民币。根据Fortune Business Insights测算,2024年AI视频生成全球规模为6.15亿美金,预计2025年达到7.17亿美金,同比增长17%,预计到2032 年达到25.63亿美金,2025至2032年的复合增速为20%。分应用来看,AI视频生成下游应用包含2B及2C两端,根据Fortune Business Insights的统计,目前AI视频生成下游需求最大的应用方向为市场营销及广告,而社交媒体的应用增长最快。
驱动因素:价格和性能共同驱动行业成长
AI视频生成产业规模受到价格以及模型能力的双重驱动。 价格方面,目前国内外主流模型的API单秒价格在0.2-1元/秒。目前主流产品采取积分制,大部分支持API接入,价格方面目 前国内外主流模型的API单秒价格在0.2-1元/秒,相对价格较高的Veo2生成价格为0.35美元/秒(约2.51元/秒),根据量子位 智库测算,顶级动画电影制作成本约为十万元级/秒,本土动画电影制作成本在万元级/秒,本土TVC视频制作成本在千元级/ 秒,不论是对比广告视频或者影视剧/电影的单秒成本,AI视频生成均具有极大成本替代优势。
模型能力提升推动可用性。视频大模型主要能力评估标准包括生成效率、内容语义的一致性、视频质量(包括时空一致性、 物理规则遵循、叙事连贯性、长序列稳定性、单帧图像的生成质量等)、动态表现、画面美学等。时长方面,当前主流的生 成时长为5-10秒,随着模型迭代时长上限逐渐突破,Veo2支持理论最高2分钟的4K视频生成,可灵大师版可以通过续写方式 将视频延长至3分钟,时长突破有望进一步满足叙事需求扩展下游应用。生成速度方面,随着硬件性能提升以及模型迭代, 整体生成速度大幅提高,以Seedance1.0为例,根据官方数据,对于 5 秒 1080p 分辨率的视频生成任务,实测推理耗 时 41.4 秒(基于 L20 测试),效率大大提升。生成质量方面,现阶段AI生成视频常常需要“抽卡”,用户需反复尝试,才 能生成相对理想结果,随着产品迭代,“抽卡率”有望降低。丰富度方面,声音内容陆续添加,如Veo3通过将视频像素转 化为语义信号,实时生成匹配的视频声音,大大增强了视频生成可用性。
行业应用:B端应用场景多元化,C端内容持续破圈
2B下游应用包括影视内容创作、商业广告、电商营销、城市文旅、动画教育、游戏娱乐等。以电商服装行业为例,由于高频 上新的需求,视频内容成本高企,AI视频内容生成极大解决该痛点。影视短片方面,AI短剧应用逐渐成熟,比如快手星芒短剧 于24年7月13日推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》,导演陈坤曾在接受《综艺报》的采访中表示,玄 幻和科幻是传统影视的两大痛点,CG特效成本高、周期长,AI可以有效缩短制作周期、降低制作成本,效果可以达到传统特效 的70%到80%。根据短剧自习室数据,该剧累计播放量突破5000万。
2C方面,创意玩法持续拉近产品与C端用户距离,内容持续破圈。比如可灵的“毛绒”特效、PixVerse的“毒液”特效等,引 发在社媒上广泛传播。
产品及竞争格局:可灵等国产厂商表现突出
从模型表现来看,Seedance1.0、Veo2/3、Kling2.0、Sora、MiniMax产品表现居前,国内模型水平达到全球领先水平。根 据Artificial Analysis最新AI视频模型表现排行,文生视频方面,字节跳动的Seedance1.0、Google的Veo3/Veo2、以及快手 Kling2.0、OpenAI的Sora表现前五;在图生视频方面字节跳动的Seedance1.0、MiniMax的Hailuo02、Google的Veo3以及快手 Kling2.0/1.6排名前五。
从商业化来看,根据The Information,Runway24年12月ARR(Annual Recurring Revenue)达到8400万美金,25年底冲击 2.65亿美金,可灵2025年3月年化收入运行率突破1亿美金,4月及5月单月付费金额均突破1亿人民币。
使用量份额角度来看,Kling表现突出。根据Poe发布的数据,截止2025年5月4日前一周使用份额情况,Kling市场份额达到了 30%,其中Kling2.0大师版4月底推出后仅三周便占据了21%的市场份额,Runway使用量份额排名第二达到23.6%,Veo-2位 列第三,份额为16.6%。
从web端访问量及APP端MAU来看,根据AI产品榜统计的5月AI视频产品web端访问量来看,Sora、Kling、Loom、Hailuo、 PixVerse访问量排名前五。移动端来看,即梦5月MAU达到3065万,PixVerse达到1998万,分别排进5月全球AI APP MAU的 第11位以及第23位。
报告节选:



(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 正泰安能:向设计要效益:AI自动化设计的实践与回报.pdf
- 艺恩报告:智驾未来:AI重塑汽车消费新纪元.pdf
- 清鹏算电:AI与电力市场应用探索——清鹏能源大模型智能体实践与展望.pdf
- 启信慧眼:全球布局洞见先行:构建AI时代的供应链韧性-2026供应链风控白皮书.pdf
- 计算机:通过AI原生,提升驾驶敏捷性和商业价值统一采购平台(英文版).pdf
- 计算机行业多模态:视频生成,2026年有望实现从1到N.pdf
- 传媒行业GenAI系列报告之69暨AI应用深度之四:Seedance2.0突破,AI视频竞争格局及产业链机遇.pdf
- 2025年第四季度视频游戏报告.pdf
- AI视频技术跃迁驱动内容革命,把握产业变革新机遇.pdf
- 快手_W公司研究报告:AI视频对应千亿级市场,可灵占据核心卡位.pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 人工智能AI产业链全景图.pdf
- 2 铀行业专题报告:AI时代的关键资源品,全球核电复兴,铀矿景气反转.pdf
- 3 元宇宙177页深度报告:人类的数字化生存,进入雏形探索期.pdf
- 4 智慧城市专题研究:AIoT时代的智慧城市跃迁.pdf
- 5 2024年AI医学影像行业发展现状与未来趋势蓝皮书.pdf
- 6 中国AI智慧操场行业研究报告.pdf
- 7 人工智能行业专题报告:从CHAT~GPT到生成式AI(Generative AI)-人工智能新范式,重新定义生产力.pdf
- 8 5G+AI的杀手级应用:VR+AR深度研究报告.pdf
- 9 埃森哲人工智能应用之道(92页).pdf
- 10 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 1 中国AI智慧操场行业研究报告.pdf
- 2 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 3 金域医学研究报告:数据资产价值重估,AI技术驱动创新应用场景拓展.pdf
- 4 MIM(金属粉末注射成型)行业专题报告:MIM在机器人、AI、消费电子领域应用前景广阔:破界生长,智领未来.pdf
- 5 医疗AI专题报告:多组学篇,AI技术驱动精准诊断实现重要突破.pdf
- 6 AI的宏观悖论与社会主义全球化.pdf
- 7 洞隐科技2025中国物流与供应链领域AI应用研究报告.pdf
- 8 电力设备与新能源行业深度报告:AI动力打造固态电池发展新引擎.pdf
- 9 2025年金融服务业中国AI现状与趋势.pdf
- 10 人工智能行业分析:AI新纪元,砥砺开疆·智火燎原.pdf
- 1 讯飞医疗科技公司研究报告:AI医疗先行者,贯通式布局医疗信息化.pdf
- 2 医药生物行业医疗器械2026年度策略:把握出海陡峭曲线,卡位AI医疗商业化落地.pdf
- 3 艾瑞咨询:2025年中国企业级AI应用行业研究报告.pdf
- 4 新经济中工作的四大未来:2030年的AI与人才(英译中).pdf
- 5 2026年半导体设备行业策略报告:AI驱动新成长,自主可控大时代.pdf
- 6 青矩技术公司研究报告:全过程工程咨询服务领军者,积极布局AI推行数智化咨询新模式.pdf
- 7 AI医疗行业专题报告:AI重构医疗,从场景落地到变现讨论.pdf
- 8 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 9 2026年AI行业应用深度展望:AI应用重塑流量格局,字节阿里腾讯C端布局加快.pdf
- 10 讯飞医疗科技公司研究报告:AI医疗龙头,GBC全场景贯通&中试基地卡位明确,规模化落地有望加速.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
