互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf

  • 上传者:一鸣惊人
  • 时间:2023/12/19
  • 浏览次数:183
  • 下载次数:8
  • 1人点赞
  • 举报

互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启。多模态:AGI必经之路与商业宏图起点。(1)多模态是实现通用人工智能的必经之路。模态数据输入可帮助模型能力和用户体验提高,允许多模 态数据输出也更符合真实世界需要。在数据、算法及算力上的要求都要高于单模态,这一波自然语言大模型发展为其他模态提供技术参考,行业 有望加速发展。(2)多模态是AI商业宏图起点。多模态大模型有望真正为企业降本增效,且企业可将节省的成本用于提高产品/服务质量或者技 术创新,推动生产力进一步提升;C端技术平权下内容创作有望达到一个成本与质量更优的均衡点,或出现新的、空间更大的UGC平台。

多模态大模型的技术脉络与前进方向:(1)视觉模型:数据与算法往往同步发展,大型高质量数据集是模型突破重要基础,而近年视觉算法在泛 化性、可提示性、生成质量和稳定性等方面突破将推动技术拐点到来以及爆款应用出现。其中2D图像生成引领视觉模型前进方向,由于2D图像生 成是视觉模型中要求相对较低的领域,因此更容易实现技术突破,也出现了midjourney这类爆款应用,其兼顾使用门槛及生成效果,数据飞轮效应 开始体现。文生图成本仍有优化空间,其中通用类应用由于需求相对刚性且有较强的付费意愿,盈利领先。3D资产生成、视频生成等领域受益于 扩散算法成熟,但数据与算法难点多于图像生成,其中视频生成当前可类比2D图像生成的2021年(已有上亿规模数据集、扩散模型取得突破), 且考虑到LLM对AI各领域的加速作用以及已出现较好的开源模型,2024年行业或取得更大的发展。3D资产生成则相对更加早期。(2)听觉模型 :数据仍有缺口,23年以来技术有所突破。未来技术成熟后可为企业/内容制造商/娱乐应用提供高性价比的音乐作品,或基于娱乐属性向C端收费 。(3)具身智能:相对远期,AI+机器人实现与现实世界交互。

海外技术领先,国内技术与应用同步发展。(1)海外:OPENAI和谷歌在多模态领域布局的广度和技术先进程度上都处于领先地位,且都推出了 表现较好的通用多模态大模型。而Stability.ai、 midjourney、runway等垂类独角兽也对技术突破和产品创新发挥重要作用。(2)国内:国内数据、 算法、算力均有劣势,但海外算法开源有利于国内技术追赶;考虑到中国科技公司在产品运营和迭代方面实力更强,技术与应用有望同步发展。 国内大厂及大模型公司均积极布局多模态,有望结合生态优势进行变现;万兴科技、美图等AI视觉应用公司亦有望受益于底层技术进步。

1页 / 共40
互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第1页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第2页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第3页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第4页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第5页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第6页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第7页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第8页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第9页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第10页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第11页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第12页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第13页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第14页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第15页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第16页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第17页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第18页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第19页 互联网传媒行业研究报告:多模态技术加速,AI商业宏图正启.pdf第20页
  • 格式:pdf
  • 大小:2.9M
  • 页数:40
  • 价格: 4积分
下载 兑换积分
留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至