中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf

  • 上传者:3**
  • 时间:2024/05/21
  • 热度:470
  • 0人点赞
  • 举报

中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速。Sora 横空出世,践行规模法则叠加强大工程化能力构筑精品。 2024 年初,Sora 横空出世,凭借惊艳的视频生成效果和分钟级的时长引领市场。 Sora 生成长达 60 秒的视频,并且可以通过自然语言、视频、图片作为提示词实 现视频生成,相比此前的其他文生视频工具性能优势显著。此外 Sora 生成的视 频还呈现出时间一致性、空间一致性和因果一致性,被 OpenAI 称为世界模拟器。 Sora 在数据、算法、算力上均大胆创新,数据方面,采用了特殊的视频编码模式 将视频模块化和压缩,构建适用于视频生成模型的时空模块,通过原本具备的大 语言模型能力构建高质量的视频文本数据集合文本生成提示词等。算法层面,引 入 DiT 算法增强可扩展性,同时加入某些自回归任务加强模型的帧间信息处理 能力。最后 OpenAI 的强大算力也是 Sora 诞生的必要因素。

世界模型——自动驾驶的下一站 。世界模型是预测未来的梦境,将全面赋能自动驾驶。世界模型即通过对世界基础 运行规律的理解来实现对未来的预测。在自动驾驶领域,预测未来可以被用于: 生成逼真、稀缺的驾驶场景助力模型的训练以及仿真验证,同时模型也可以直接 生成驾驶策略指导自动驾驶运行。而在端到端算法时代,产业对合成数据、闭环 验证的需求进一步增强,世界模型的重要性凸显。目前在自动驾驶领域,特斯拉 开发了 World Model、Wayve 开发了 GAIA-1、英伟达亦推出自身的基础模型, 诸多玩家推出相应产品来实现驾驶场景的视频生成等任务。而在学术界,多种世 界模型亦层出不穷,以 DriveDreamer 为例,模型不仅可以实现驾驶场景的生成, 更能生成驾驶场景下所应该实现的驾驶行为,为世界模型应用打开想象空间。

世界模型、视频生成殊途同归,自动驾驶有望迎加速。面向相似的目标,采用相近的方法,多种任务殊途同归,自动驾驶未来已来。 视频生成领域,Sora、Runway 等均表达了希望进军世界模型的想法,而“预测 未来”对自动驾驶乃至具身智能都存在不可替代的意义,长时间、稳定的对未来 的场景进行预测是诸多行业面临的难点。而在算法架构方面,我们看到视频生成 和自动驾驶的世界模型均有诸多相似之处,均将复杂外部世界获取的数据进行编 码和压缩、抽象成为低维度的向量,并采用 Transformer 或者其他模型在时空维 度学习这些知识进而实现预测,再通过不同类型的解码器将之前生成的潜在空间 的向量解码成为我们所需要的信息形式,如视频、点云、甚至执行器的控制信息 等。而我们也看到在 Sora 的启发下,OpenSora、Vidu 等视频生成工具迭出,效 果不俗。大模型开发和自动驾驶汇集 AI 领域诸多优秀人才和资源,相似的开发 方向有望让产业互相借鉴,加速产业发展,推动自动驾驶加速实现。

1页 / 共29
中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第1页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第2页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第3页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第4页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第5页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第6页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第7页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第8页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第9页 中小盘策略专题:Sora和世界模型殊途同归,自动驾驶行业有望加速.pdf第10页
  • 格式:pdf
  • 大小:4.1M
  • 页数:29
  • 价格: 6积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至