AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf

  • 上传者:0******
  • 时间:2024/08/12
  • 热度:484
  • 0人点赞
  • 举报

AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地。大模型能力提升阶段性放缓之际,我们提示关注“AI落地”进展:如大模型侧“开 源”“轻量”“端侧”化趋势显著,视频、音频等领域AI自6月以来更新频出。

大模型侧:开源能力快速提升,轻量化趋势显著。2024年以来,大 模型发展呈现三大趋势:1)开源模型发展,能力快速接近闭源产品 水平;2)“轻量化”,模型“性价比”快速提升;3)端侧模型发展, AI 硬件已经开始布局。这些都意味着 AI 大模型的发展在向着落地 可行方向进发。

AI生成视频:能力兑现有望加速。自从2024年2月OpenAI sora 演示视频放出,AI视频领域的行业标准被显著提高,而经历4个多 月的积累后,6-7 月国内外多个团队交出“类sora”产品的首份答 卷:国内有多次迭代、面向全球、快速商业化的快手可灵,从文本 大模型发家的独角兽企业智谱;海外则有持续保持高生成质量的 Runway Gen3 Alpha、有 3D 生成相关经验帮助的Luma。这些产 品的生成效果都比“前sora 时代”的产品有显著提升,预示着 AI 视频领域的预期或加速兑现。

语音功能:或助推AI产品迭代。GTP-4o的高级语音功能已经在7 月底开始小范围测试,这一功能使得 AI 可以从用户语音中获得情 感、语调等更丰富的信息,回应时也可以体现出语调等更丰富的表 达,且交互延迟小、可被打断,AI语音交互的体验预计有显著提升。 该领域AI技术的发展有望对教育、情感陪伴等应用场景的使用有改 进效果,对人机交互体验提升将有所帮助。

1页 / 共23
AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第1页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第2页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第3页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第4页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第5页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第6页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第7页 AI行业更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.pdf第8页
  • 格式:pdf
  • 大小:2.8M
  • 页数:23
  • 价格: 6积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至