AI视频专题研究:智能影像新纪元.pdf

  • 上传者:小龙人
  • 时间:2023/12/11
  • 浏览次数:132
  • 下载次数:13
  • 0人点赞
  • 举报

AI视频专题研究:智能影像新纪元。技术路线:基于扩散模型的AI视频工具发展迅速,数据、算力、算法驱动产品完善。高度灵活且易于计算的扩散模型是当前AI视频工具的主流 底层模型,催生Runaway Gen 2、SVD、Pika 1.0等AI视频工具,拥有文/图/视频生视频、局部重绘、故事板、3D合成多重功能。AI视频已经取 得初步进展,在数据、算力、算法提升的驱动下有望不断完善:1)数据集:量级多在千万级,例如根据WebVid官网数据,截至2023年12月, 常用文本-视频数据集WebVid-10M拥有1070万个文本-视频对,较文生文和文生图的训练集更少;2)算力:从调用API价格推测,视频生成所 需算力成本近似于逐帧图片生成成本,算力消耗更大;3)算法:VAE分解合成、将时间维度引入潜在扩散模型等方案有效提高动作的逼真感和 视频的分辨率,“从粗到细”、并行联合去噪等路线则为生成时长提供有效解决方案。

模型实测:动作流畅度、画面美感表现好,文本理解待深化,迭代版本效果显著提升。横向对比上,我们Pika Beta、Stable Video Diffusion、 Runaway Gen 2文生视频模型进行实测,三大模型分别能在30/60/70秒生成高质量的3~4秒视频,Runaway Gen 2的综合表现相对占优。三大 模型在文本理解方面还有待深化,我们推测主要是训练数据量的限制。纵向迭代上,PIKA 1.0的视频生成效果相比Pika Beta版本在智能创作、 场景渲染、细节渲染、解剖结构等多个维度均有显著提高,仅用6个月时间实现突破进展。

前景展望:影视内容、广告、游戏、教育等领域应用广泛,2028年市场空间有望达到573亿元。各厂商的产品功能逐渐丰富、生成效果持续提 升、交互平台更加完善,影视内容、广告、游戏、教育等领域应用广泛。在25%AI视频渗透率的假设下,我们预测2028年市场空间有望达到 573亿元。

1页 / 共31
AI视频专题研究:智能影像新纪元.pdf第1页 AI视频专题研究:智能影像新纪元.pdf第2页 AI视频专题研究:智能影像新纪元.pdf第3页 AI视频专题研究:智能影像新纪元.pdf第4页 AI视频专题研究:智能影像新纪元.pdf第5页 AI视频专题研究:智能影像新纪元.pdf第6页 AI视频专题研究:智能影像新纪元.pdf第7页 AI视频专题研究:智能影像新纪元.pdf第8页 AI视频专题研究:智能影像新纪元.pdf第9页 AI视频专题研究:智能影像新纪元.pdf第10页 AI视频专题研究:智能影像新纪元.pdf第11页 AI视频专题研究:智能影像新纪元.pdf第12页 AI视频专题研究:智能影像新纪元.pdf第13页 AI视频专题研究:智能影像新纪元.pdf第14页 AI视频专题研究:智能影像新纪元.pdf第15页
  • 格式:pdf
  • 大小:2.3M
  • 页数:31
  • 价格: 3积分
下载 兑换积分
留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至