2023年MR行业深度跟踪报告:MR,创造新范式

  • 来源:中信证券
  • 发布时间:2023/12/26
  • 浏览次数:1395
  • 举报
相关深度报告REPORTS

MR行业深度跟踪报告:MR,创造新范式.pdf

MR行业深度跟踪报告:MR,创造新范式。AppleVisionpro:顶尖硬件,发售在即。根据苹果公司2023开发者大会,其首款MR头显设备Visionpro计划于2024年初在美国发售,其M2+R1双处理器、2300万像素定制Micro-OLED屏幕、多颗摄像头和传感器等配置均展现了当前消费电子领域顶尖的参数水平,显著领先于市场上已有的相关产品。我们认为,Visionpro在硬件和设计思路上具备一定的独特性,料将提供全面超越当前市场产品的硬件体验,并为MR产品硬件形态提供新范式。“空间计算”有望开启交互新范式。Visionpro强调以3D体验为基础的“空间...

Vision pro 发售在即,硬件加速迭代优化

XR 是下一代科技硬件,3D 交互的关键设备

下一代智能终端的关键特点在于 3D 自然交互, XR 有望成为自底层算力到上层应用 的重要科技载体。回溯互联网时代的发展历程,从 PC 互联网到移动互联网,历次科技进 步均催化出跨越时间周期的硬件载体,如 PC 互联网时代下的个人电脑、移动互联网时代 下的智能手机,同时带来底层算力、基础软件、上层应用等彼此促进、相互成就的螺旋式 发展轨迹。多年来,VR/AR 被寄予下一代智能终端的希冀,但无论从出货量的角度,抑或 是生态发展的角度都难以令人信服。究其原因,我们在《元宇宙深度跟踪报告—从 Pico 出发:中国 VR 整机的挑战与机遇》(20220823)中对硬件方面的不足总结如下:1.头显过 重;2.续航较短;3.沉浸感不足;4.对使用场景有限制。随着科技巨头苹果的入场,Vision pro 的发布为行业带来新的思考,在硬件表现方面,其集合了本世代能够提供的最先进技 术,用户体验方面有望得到大幅改善。我们认为,随着底层算力的不断提升,AI 技术的快 速渗透,人机交互的方式将从 2D 转变为更加自然的 3D,预计 XR 将成为未来重要的科技 载体。苹果的入局,有望为行业带来从硬件到软件生态的新的思考和变化,并带来相对应 的投资机会。

Vision pro 集成领先硬件能力,引领进入“空间计算”时代

Vision pro 集成多项领先技术,有望大幅提升用户体验。2023 年 6 月,苹果公司在 2023 开发者大会(WWDC)上发布首款 MR 头显设备 Vision pro,售价为 3499 美元,计 划于 2024 年初在美国发售。苹果 CEO Tim Cook 在 WWDC2023 大会上表示,Mac 引领 进入“个人计算时代”,iPhone 引领进入“移动计算时代”,Vision pro 将引领进入“空间 计算时代”。Vision pro 集成了多项 XR 领域的先进技术,以帮助用户实现更加沉浸的应用 体验,包括:视频透视(video see-through)、眼动追踪(eye-tracking)、3D 渲染、3D 相机、手势识别、声音输入控制等。此外,为了呈现更好的 3D 内容,苹果打造了首个具有三位界面的空间操作系统 VisionOS,可以实现 iPhone/iPad 的 APP 协同。从功能实现 的角度,我们认为 Vision pro 提供了 XR 产品的绝大多数能力,其在硬件方面的升级优化 有望为用户带来更佳的使用体验。

硬件用料豪华,确保更佳视听感受。Vision pro 采用更为自然的人机交互方式,并提 供更沉浸的视听感受,上述功能的实现离不开硬件端的加持,主要体现在:1) 芯片:搭载苹果 M2 芯片与 R1 芯片。其中,M2 芯片用以执行 VisionOS、图形 处理等计算;R1 芯片主要用于高速数据传输以消除延迟,可以处理来自摄像头、 麦克风以及其他传感器的信号,处理时长在 12 毫秒以内。 2) 显示:搭载 2300 万像素定制化 Micro-OLED 屏幕,支持 4K 广色域视频和 HDR 渲染。配备三层 Pancake 透镜组。 3) 传感器:12 颗摄像头+5 颗传感器,提供手势识别、头部识别、实时 3D 扫描等功 能。 4) 声学:双驱动音频 pods+6 个麦克风,提供空间音频效果。

回顾 iPhone 连点成线,Vision pro 有望定义 MR 形态

回顾:iPhone 串联起时代技术,开启移动互联网行业红利。从硬件角度而言,智能 手机的革新离不开三大硬件的底层支持:片上系统(SoC)、多点触摸屏和大容量锂电池, 同时高分辨率摄像头等硬件进步也极大丰富了智能手机的应用场景。片上系统(SoC)的 发展全面提升了智能手机在图形、视频及 3D 处理能力方面的提升;多点触摸屏则取代了 键盘开启全新的交互方式;大容量锂电池替代了前几代电池成为智能手机标配,大幅提升 续航时间。同时,高分辨率摄像头的加入极大丰富了智能手机的应用场景。iPhone 作为连 点成线的集大成产品,将多点触控屏幕、操作系统、应用开发平台、SoC 芯片、电池、云 储存等关键技术串联起来,无论是真正开启智能手机时代的第一代 iPhone,还是奠定苹果 在智能手机领先地位的划时代产品 iPhone 4,抑或是引领全面屏时代的 iPhone X,苹果 的每一次创新革命都引领着全行业的进步,智能终端产品的持续迭代亦拉开了整个移动互 联网浪潮的大幕。

展望:虚拟现实技术仍在加速发展,Vision pro 有望定义 MR 设备。根据中国信通院, 虚拟显示技术仍处于发展阶段,部分技术如全息显示、深度学习渲染等仍在研究进程之中。 目前,市面主流产品停留在“产品可用”的阶段,从硬件角度而言,主要是因为产业化进 程较早,先进技术的应用落地尚未形成规模效应,成本较高,从而使得 VR/AR 厂商在产 品研发时面临“价格 vs 体验”的困局,同时技术上的不足亦成为产品难以大规模推广的 核心原因之一。与目前市场上主流产品的定价策略不同,苹果 Vision pro 售价显著高于同 类产品,根据 Wellsenn XR 对几款主流产品的 BOM 拆解,苹果 Vision pro 在光学、显示 等方面投入较大,我们预计其硬件端的大量投入或使得产品在视觉表现等方面得到较大幅 度的提升。凭借苹果自身的软硬件生态优势,我们认为初代产品的较高定价并非核心考虑 因素,供给侧产能偏紧的态势或将为后续投资布局带来机会。

硬件快速更新迭代,产品体验优化升级

硬件能力创新高,芯片、光学、显示、交互迎来升级。芯片层面:Vision pro 采用 M2、 R1 双芯片设计,提供 12 毫秒以内的低延时实时渲染能力;目前市场主流 VR 设备采用高 通骁龙 XR 系列芯片。光学:Vision pro 采用三层 pancake 方案,使得头显设备更加轻薄; 主流 VR 设备采用双层 pancake 方案。显示:Vision pro 采用定制化 Micro-OLED 屏幕, 单眼分辨率超过 4K,渲染画面更加清晰逼真;目前主流 VR 产品采用 Fast-LCD 屏幕。交 互:Vision pro 取消手柄设计,采用手势识别、语音交互、眼动追踪等方式进行交互;目 前主流 VR 产品均配备手柄使用。

芯片:双芯片设计,为图像渲染及交互处理提供支持。根据苹果公司官网介绍,Vision pro 搭载 M2 芯片以及 R1 芯片,其中 M2 芯片计算性能显著高于 iPhone,能够帮助用户 获得更加流畅高清的画面渲染效果,高通骁龙 XR2 芯片性能与手机端的骁龙 865 接近。 R1 芯片是专门为处理 Vision pro 摄像头及传感器的信息而设计的,12 毫秒以内的处理速 度可以使用户几乎感受不到外界世界与虚拟世界的时钟差异。从制程角度,苹果 M2 芯片 采用 5nm 制程;高通骁龙 XR2 采用 7nm 制程;高通骁龙 XR2+Gen1 采用 4nm 制程。综 合判断,我们认为 Vision pro 在 M2+R1 芯片的加持下,其优秀的计算能力(图形渲染能 力)、大缓存、低延时等方面,具备领先其他产品 2~3 年的优势。

光学:从菲涅尔走向 Pancake,3P Pancake 带来更大视场角。自 VR 产品进入大众 视野,其光学解决方案经历了非球面透镜、菲涅尔透镜、Pancake 等技术路径,其核心要 解决的问题为:1.更大的视场角;2.更短的光学镜头总长(TTL);3.更小的成像畸变。菲 涅尔透镜去除光线直线传播的部分,保留折射发生的曲面,相对于非球面透镜减少了重量 与体积,但带来了成像畸变的困扰;Pancake 方案采用将光路折叠的方式,实现了更短的 TTL,从而大幅降低头显的厚度,但视场角较小,且贴膜工艺难度较大。苹果 Vision pro 采用 3P Pancake 方案,根据 The Information,预计苹果 MR 视场角达 120°,超过目前 市场主流 VR 设备。同时由于层数的增加,分散镀膜能够在一定程度上降低工艺难度。

VR 光学市场有望随着整体出货量的上涨而扩大市场空间。根据 Wellsenn XR 预测, 到 2030 年全球 VR 出货量将达 4 亿台。按单片非球面透镜 5~10 元、单片菲涅尔透镜 15~20 元、单个 Pancake 光学模组 150~200 元计算,在 Pancake 占比逐步提高的假设下, Wellsenn XR 预测 2030 年全球 VR 光学的年市场规模达 500 亿元。

屏幕:从 Fast-LCD 走向硅基 OLED,屏幕是沉浸式体验的重要一环。与光学方案类 似,XR 屏幕显示也有不同的解决方案,在 VR/MR 领域较为常见的包括 AMOLED、 Fast-LCD、硅基 OLED 等。屏幕显示是决定 VR 设备沉浸度的关键环节,屏幕显示的迭代 优化方向为更清晰的显示效果、更锐利的细节显示、更流畅的视频体验等,其分别对应着 更高的分辨率、更高的 PPI、更高的刷新率等。根据中国信通院,屏幕分辨率是决定 XR 沉浸式体验的重要环节,完全沉浸的体验层级需要单目屏幕分辨率达 8K 以上。目前市场 产品仍以 2K~4K 的单目分辨率为主,苹果 Vision pro 搭载的定制化硅基 OLED 屏幕实现 了单目分辨率超过 4K 的水平。

由于自身材料特性以及独特的工作原理,不同的显示技术呈现出差异化的性能指标。 硅基 OLED 以单晶硅芯片为衬底,在 CMOS 驱动电路顶层制作 OLED,其 PPI 可达 3000 以上,刷新率能够满足 90~120Hz,单目分辨率能够实现 2.5~8K,是 VR 设备显示领域的 优秀选项之一。

苹果 Vision pro 采用 Pancake 光学模组设计方案,其理论最高光学效率仅为 25%, 为实现更佳显示效果,Vision pro 搭载定制化硅基 OLED 屏幕,从而实现更高的亮度。目 前市面采用 Pancake 方案的主流 VR 设备多采用 Fast-LCD(如 Pico4, Meta Quest2)、 OLED(索尼 PS VR2)或 Mini LED(Meta Quest Pro)等屏幕,相较之下虽然硅基 OLED 成本较高,但从分辨率、反应时间、功耗等角度看具有无法比拟的优势。

显示屏幕是 XR 设备的核心器件之一,其市场规模将伴随 XR 市场的增长而扩大。根 据 Wellsenn XR 预测,综合考虑硬件显示效果以及行业量产进程,未来全球 XR 屏幕主要 将由 LCD、硅基 OLED、Micro LED 提供,预计到 2025 年,在 XR 领域,LCD 屏幕市场 规模为 6.8 亿美元,OLED 屏幕市场规模为 6 亿美元,Micro LED 屏幕市场规模为 0.5 亿 美元;预计到 2030 年,在 XR 领域,LCD、硅基 OLED、Micro LED 屏幕市场规模分别 达 24 亿/94 亿/76 亿美元。

交互:脱离手柄束缚,生活场景下实现更自然交互。VR 自然交互方式包括手势识别、 语音控制、面部追踪、眼动追踪、视频透视、震动反馈等。Vision pro 取消手柄,采用手 势识别直接进行交互,可以有效扩展传统桌面交互形式;采用眼动追踪,通过眼神注视选 取对应操作;采用动作捕捉,识别用户面部、身体各部位动作进行实时渲染;全彩透视, 可以实现用户侧虚拟世界/真实世界的无缝切换,减轻虚拟和现实之间的边界感;控制显示 器,可以连接 Mac 等苹果生态设备并作为外接显示器,带来全新的交互方式。

MR+游戏:空间+交互形式变革带来创新体验,轻度游 戏有望率先落地

范式革新,空间+交互形式全变革带来游戏行业新可能

传统游戏体验受制于硬件设备,MR 带来高交互、高便携、高沉浸。传统游戏交互以 2D 平面视觉作为基础,依赖键盘鼠标(PC)、手柄(Switch)或是屏幕点击滑动(手机)等硬件设 施进行人机交互。这种交互模式下,往往需要将使用者和硬件设备进行空间绑定,使得玩家需 要在便携性和高体验性之间进行取舍,追求更高的体验性意味着需要更大的显示屏幕、显卡、 处理器等硬件,在便携性上则将受到一定限制,反之亦然。而与 MR 结合后,主要画面构成为 3D 空间,增强了画面流畅度和游戏沉浸感,而对硬件设备的需求仅为 MR 眼镜,重量显著低于 电脑、手机、游戏主机等传统设备,有效提升随身携带、随时使用的便捷性。交互模式上,用 手势互动代替了传统的点击和触摸,具备更高的交互性和体验性。

应用探索仍处早期,轻度游戏有望率先与 MR 结合落地

MR+游戏的普及仍需进一步的技术升级、资金驱动、人才深耕及用户心智培养。技术 侧,MR 内容强调 3D 环境,游戏内容创作门槛高,设备要求、创作成本等均高于传统模 式。以 MR 混合现实处理问题为例,当前大部分 MR 产品存在在混合现实处理过程中对现 实进行加工的误差问题,能否精准分析现实和虚拟的变化,并进行加工操作,将大大影响 内容的生成。此外,行业头部公司对于 MR 的资金投入及人才吸引、用户心智的培养也是 短期制约 MR+游戏发展的重要因素。 轻度游戏有望率先与 MR 结合落地。考虑到大型重度体验游戏对硬件及技术水平有较 高要求,我们认为轻度游戏有望率先与 MR 结合落地,MR 的面对面交互优势也有望帮助 MR 游戏构建多人参与的玩法,发挥社交优势。例如,休闲轻度游戏万代南宫梦的吃豆人 在 2023 年 8 月推出 AR 体验,Meta 在 2023 年 12 月发布 MR 冒险游戏《Demeter》,任 天堂的《精灵宝可梦 GO》将在 2024 年融合 AI 和 AR 技术,均是 MR 与游戏结合的积极 探索。

新范式带来新机遇,率先布局厂商有望占得先机

主题热度和产品共振,关注相关公司布局。对游戏玩家而言,MR 与游戏的结合有望 帮助玩家实现平面视角或伪 3D 视角向真 3D 视角的转化,通过眼动、语音、手势实现更 自然的交互。对游戏开发商及设备厂商而言,3D 游戏需要更大规模的数据处理能力及空 间构造能力,更流畅的交互操作需要更灵敏的反应机制及数据分析能力,这都对厂商的技 术水平和数据处理水平提出了全新的要求,率先布局的厂商有望在下一个游戏革新浪潮和 用户心智争夺中占得先机。

MR+影视及应用:MR 重塑观影体验,社交、电商可期

MR+影视具备落地条件,PGC 及 UGC 共创内容繁荣

硬件体验升级+内容生态丰富,MR+视频具备落地条件。硬件端,随着苹果 Vision Pro 的推出,MR 更前沿的显示屏和光学透镜实现了更大的 3D 画面,并具有更高的画质,从 而使得用户能够拥有更加沉浸的观看体验。同时,还可以通过调节虚拟和现实的比例以调 整沉浸感,降低对观影场景和条件的依赖度。内容端,现有内容平台丰富的影视作品积累 及创作能力将为 MR 提供丰富的内容供给。以爱奇艺为例,自 2016 年以来,其已推出《无 主之城 VR》、《仙剑奇侠传四 VR》、《杀死大明星》、《遗愿》等多款 VR 内容。进入 MR 时 代,现有影视内容有望通过 3D 重制实现更好的观影体现,而新技术驱动下亦有望带来内 容创新的突破。

内容创作:PGC 及 UGC 各具优势,有望共同驱动 MR 内容繁荣。MR 内容创新领域, PGC 和 UGC 各具优势。PGC 角度,相较传统的绿幕+抠图的虚拟拍摄方式,XR+LED 具 有成本低、周期灵活、制作相对简单的优势。同时,XR 拍摄背景的无限拓展可以在屏幕 上实现虚拟世界的全方位构建,使得影片拍摄效果更加真实自然。此外,场景制作完毕后 即进入数字资产库,后续可根据拍摄需要灵活复用,从而大幅降低了布景成本。UGC 角 度,MRC(Mixed Reality Capture Tool,混合现实捕捉工具)2019 年以来快速迭代,大 幅降低了 MRC 视频的制作门槛,有望激活 UGC 的视频内容创作。PGC 和 UGC 制作工 具的迭代及制作效率的提升,有望共同驱动 MR 内容创作繁荣。

其他应用:MR+社交、电商有望创新体验

社交方面,与 MR 结合后,用户能够互相看到自然动态的面部和手部动作,同时,通 过空间音频技术,用户能够清晰分辨出每个人的声音和对应的位置,从而使得线上交流更 加自然真实,能够广泛运用于视频通话、聚会、会议等社交场景中。 电商板块,通过 MR 试穿、MR 逛商超等场景,增添购物趣味,通过更生动、具有乐 趣的购物体验激发提升用户购买转化。

内容生产及软件支持:内容生态日益繁荣,空间计算 应运而生

MR 内容生产及软件支持包括内容制作、平台技术两大核心部分。内容制作包括采集、 编辑、播放以及商业转化环节,采集环节包括实景拍摄、虚拟制作、2D 转制等方法,为 MR 内容供给提供保障。平台技术包括操作系统、开发工具、内容平台、识别交互等,伴 随“空间计算”时代的开启持续优化。在内容创作能力提升助推 MR 内容生态有望日益繁 荣的同时,软件升级有望带来用户体验的丰富和应用领域的拓展。

内容制作:设备升级、AI 赋能等降低创作门槛,UGC 占比有望提升

1. 内容采集

内容采集环节中,实景拍摄、虚拟制作、2D 转制是主要方法,提供 MR 的内容基础 ——3D。MR 技术是虚拟物体与现实场景的混合,能够创造出一种可视化的交互环境。而 3D 内容可以描述物体的形状、大小、位置和方向等三维信息,从而呈现立体的视觉效果。 这种立体效果使得观众能够感受到三维空间的存在,从而更加真实地感受到虚拟物体和场 景,是 MR 内容的基础。

1)实景拍摄方法: 3D 拍摄是利用双镜头摄影技术来模拟人眼视觉系统的影像方式,主要有平衡和交叉 两种方式。3D 拍摄主要通过 3D 摄影机等成像设备实现,3D 效果实现主要基于立体成像 原理,即当我们注意某个事物时,该事物会在人体的左右两眼中同时产生影像,大脑自动 合成双方信息,进而产生立体感。拍摄方式上,平衡方式只需考虑瞳距就能实现立体拍摄, 方法简单,广泛应用于特种电影;交叉方式则除瞳距之外,还要考虑零点的距离,因而在 物理层面更加接近人类的生理双眼对焦,具有更加顺滑、逼真的立体效果,广泛应用于长 时间的 3D 拍摄,更有利于故事的传达。目前,垂直的拍摄支架能够支持交叉拍摄的方式, 3D 软件则能自由支持平衡和交叉两种方式。

相比 2D 拍摄,3D 拍摄在数据处理、拍摄环境、设备性能、成本消耗等方面具有更高 要求。①数据表示和处理:2D 视觉处理对象是平面图像或视频,即长度和宽度;3D 视觉 处理对象是三维立体空间中的物体和场景,不仅包含长宽,而且还包含深度(即点到观察 者的距离)。②拍摄环境:2D 拍摄对于光线的方向和强度没有特别要求,只需保证足够的 亮度以获得清晰图像;3D 拍摄中需要保证相机之间的光路一致,以确保获取一致图像。 ③设备性能:传感器上,3D 传感器通常由多个摄像头+深度传感器组成,以此实现三维信 息采集;算法技术上,2D 相关算法基于图像的像素信息,如边缘检测、特征提取等,而 3D 相关算法则基于深度图或点云数据,如深度估计、点云处理、三维重建等。④成本消 耗:3D 和 2D 拍摄的成本差异来自设备、场地、制作等全方位,伴随拍摄设备、专业影棚 等技术成熟,实景 3D 的拍摄成本仍有下探空间,但目前整体仍高于 2D 拍摄。

3D 实景拍摄行业呈现设备功能化、虚拟摄像棚需求兴起、UGC 成为 3D 内容重要来 源等新趋势。

①设备呈现移动化、功能化的发展趋势。最初的 3D 摄像机是双机系统,即使用两台 摄像机分别捕捉左右两个视角的图像,这种双机系统需要精确对齐和同步,以确保 3D 效 果的准确性和稳定性。后来,只需使用单个镜头和特殊的成像技术即可同时捕捉双视角图 像的 3D 摄像机问世,例如佳创视讯推出 LOOPS CAM 幻镜相机,是市场首款真正实现机 内实时拼接渲染合成的 180°-8K60 帧-3D 相机,可应用于 VR 直播等领域。近来,移动 设备的 3D 拍摄功能逐渐成熟。2023 年 12 月 12 日,苹果正式官宣已在 iPhone 15 Pro 和 iPhone 15 Pro Max 上线空间视频(Spatial Video)功能,主要通过主摄和超广角摄像头 同时工作以及多传感器的辅助实现 3D 拍摄,并能在 Apple Vision Pro 上同步再现,3D 拍 摄逐渐成为移动设备的一项功能。

②UGC 成为 3D 内容的重要来源。过去,3D 拍摄需要专业的设备、技术以及团队, 制作门槛高且成本高昂,3D 内容供给相对稀缺,主要由 PGC(专业生产内容)构成。如 今,伴随技术的发展演进,3D 拍摄的设备门槛已经降低到手机等移动端,普通用户也可 以拍出 3D 视频,UGC(用户生产内容)有望成为 3D 内容的重要来源。

③虚拟摄像棚等辅助拍摄效率提升。根据影视工业网,截至 2022 年底,全国 200 余 家影视基地中,已有近 40 家影视基地拥有数字影棚。根据北京青年报,上海科技影都·长 三角国际影视产业园中的 LED 虚拟摄像棚已投入使用。虚拟拍摄(VP)指将预先制作好 的数字场景投映到 LED 屏幕上,演员在屏前表演,摄影机通过实时校准将虚拟背景和真实 前景自然融合。根据长三角国际影视中心,选择 LED 虚拟影棚可以节约 95%场景搭建成 本、削减 75%交通费用、减少 90%群众演员预算等。

2)虚拟制作方法: 硬件设备迭代催化,内容制作软件需求激增。硬件和软件技术的不断成熟以及应用生 态的发展,带动大量 3D 内容需求。伴随 3D 内容需求的激增,内容创作软件应运而生, 创作者可以借助这些软件完成建模、渲染和动画等流程,创造出更加逼真、精彩的 3D 内 容。根据 Insight Partners 的报告,2021 年全球 3D 内容制作软件市场规模已达 1,278 亿 元,预计 2028 年可达 2,757 亿元。

3D 建模、渲染、动画是内容制作的核心环节,3D 引擎综合支持内容创建。3D 建模 工具可以帮助创作者在计算机中创建包含各种形状的三维模型;渲染工具可以将光照、材质等数据转换成最终的图像,以呈现出逼真的视觉效果;动画工具则可以赋予静态三维模 型运动力和表现力。在内容开发前期,3D 素材、模型等通过 Maya、3D Max 等软件进行 创造,操作相对简便,但在后期执行环节,开发者需要处理大量复杂的渲染、特效等流程 并考虑各环节之间的互动性,难以通过单一软件逐步实现高质量效果。因此,集成“3D 图形+实时渲染+实时交互”等多重功能的 3D 引擎能够提供灵活易用的开发套件,成为广 泛应用的内容制作工具。根据 Medium,2021 年 Unity 和 Unreal 在全球引擎市场的份额 分别为 49.5%、9.7%,市场呈现双寡头格局。其中,根据 Unity 官网,在游戏排名前 1000 名的开发者中有 70%选择 Unity 作为移动游戏引擎。

低代码开发工具协助非专业开发者快速创建 3D 虚拟内容,从而降低创作门槛,丰富 内容供给。例如蓝亚盒子(Layabox)是 3D 数字零代码创作工具提供商,其自研的 UGC 游戏平台 LayaMe 以“手机即可创作”为主要特点,大大降低游戏制作门槛,有效提高内 容创作者的转化率,目前已拥有超百万的开发者生态。此外,消费级轻量元宇宙众创平台 Layaverse 于 2022 年 11 月正式上线,全面采用 H5 和小程序免安装模式,可以直接在浏 览器、微信等平台运行,运营成本仅为同业的 1/100,具有免安装、全平台、低成本三大 特性。Layaverse 上线半年内便服务政务、工业、美妆等各领域,合作伙伴包括工信部、 资生堂、五粮液集团等。2023 年 11 月,掌趣科技和 Layabox 达成战略合作协议,双方将 共同打造一款具有创新意义的 AI 游戏引擎,有望实现“文生 3D 场景”的功能落地,将显 著降低内容制作门槛,丰富 3D 内容供给。 人工智能技术为 3D虚拟制作提供更多可能。AI领域多项技术发展迅速,其中以 GPT、 Stable Diffusion、Pika 等为代表的多模态模型和生成工具在文本、图像、视频等领域取得 重大突破,有望充分赋能 3D 内容制作。例如 2023 年 6 月 27 日,Unity 官宣新产品 MuseAI 平台及 Sentis 智能驱动,在 MuseAI 上只需输入文本即可创建角色动画、2D 资产并生成 逼真纹理,Sentis 工具则可以利用 AI 驱动角色动画并实现智能交互,有望加速游戏、VR/AR、 元宇宙等实时 3D 应用的创建。2023 年 11 月 30 日,Pika 正式对外发布 Pika 1.0,支持 3D 动画、动漫或电影等多种视频风格。

3)2D 转制方法: 2D 转制 3D 可以充分利用已有内容,AI 赋能助力效率提升。内容方面,根据苹果发 布会,苹果已与华特迪士尼公司(Walt Disney)、杜比实验室(Dolby Laboratories)等六 家合作伙伴讨论 MR 内容开发事宜。其中,根据公司公告,截至 FY2021 末,迪士尼流媒 体平台 Disney+已上线 3.3 万部剧集、1850 部电影,拥有海量内容储备。效率方面,转制 成本低于直拍,AI 赋能为短时转制提供可能。根据国际在线娱乐报道,2012 年《泰坦尼 克号》的 3D 转制共投入 60 周时间、300 多名科技人员,成本总计 1800 万美元。根据极 客视界,2017 年 100 分钟时长影片的 3D 转制成本约为 600 万元,是 3D 直拍成本的 1/10。 2023 年 8 月,来自上海交通大学、HKUST、微软研究院的学者提出 Make-It-3D 方法,该 方法可以直接利用单张图片创建高保真度的 3D 物体,或有效提高 3D 转制效率。

2. 内容编辑

内容编辑环节中,视频间内容拼接缝合是实现全景视频的必备工具。3D、VR 等相机 采用多镜头同时拍摄的方式,因此需要对各镜头拍摄的内容进行精准拼接缝合处理。根据 实现方式不同,可以分为实时、离线拼接与自动、手动拼接等。2016 年,英伟达推出 VRWorks 360 Video,能够协助内容创作者从多达 32 台摄像机中获取视频源,再以离线 或实时的方式将这些视频拼接成为 360 度全景视频。

3. 内容播放

VST 和 OST 是当前两大主流透视方案。VST(Video See-Through,视频透视)通过 摄像头等传感器对现实世界录制并同步投射到屏幕中呈现,即将现实世界转化为虚拟世界, 代表设备包括 Apple Vision pro、Meta Quest pro 等。OST(Optical See-Through,光学 透视)通过摄像头定位和芯片计算,直接观看虚拟物品和现实世界的交互,代表设备包括 Microsoft HoloLens 系列、Rokid max pro 等。其中,VST 在 FOV、虚拟内容画质等方面 具备优势,OST 在亮度、延时程度、重量功耗等方面具备优势。当前,VST 和 OST 方案 并驾齐驱,而 OST 因在轻便性方面具备绝对优势,符合用户对 MR 终端设备的强烈需求, 有望成为未来主流方案。

4. 内容商业化

在 MR 内容生产的商业转化方面,既可以通过服务、内容、订阅等软件付费模式直接 贡献收入,也可以间接提高下游行业的商业价值转化效率。

1)服务付费:例如飞天云动主要业务包括 AR/VR 营销服务、内容开发以及 SaaS 平 台。公司拥有自研的 AR/VR 开发引擎,可以根据客户需求打造定制化内容,同时利用 AR/VR 内容业务积累的技术及经验为营销服务和 SaaS 业务提供支持。营销服务方面,飞 天云动提供 AR/VR 内容模块及开发工具,帮助客户放置广告。SaaS 业务方面,客户可以 订购或要求定制 SaaS 平台,自己生成、发布及应用 AR/VR 内容。针对三项业务,公司 分别采取不同的收费机制。

伴随 AR、VR 技术在营销及广告行业的应用与普及,预计未来将有更多的广告素材 及营销形式以 AR/VR 形式呈现。AR/VR 营销模式更具智能化、场景化、定制化和社交化, 可以更好地向用户展示品牌形象并售卖产品,有望吸引广告主投放。根据艾瑞咨询,2021 年中国 AR/VR 内容及服务市场规模为 217.1 亿元,其中营销行业为 24.1 亿元,占比 11.1%; 预计 2026 年 AR/VR 内容及服务市场规模可达 1302 亿元,其中营销行业为 201.7 亿元, 占比 15.5%。

2)内容付费:以恒信东方为代表的内容提供商采取与游戏行业类似的商业模式。例 如《水浒传之醉铁拳 VR》于 2021 年 1 月在 Steam 发售,定价 70 元,总计发售约几万套, 在总流水的基础上与平台进一步分成后(Steam 综合约为 3:7),最终得到内容提供商的 实际收入。根据 Meta Reality Labs 的深度调查和 GDC,截至 2022 年 1 月,Quest 商店 总营收已超 10 亿美元,总计发布 400 多款 VR 应用,其中 60%为 VR 游戏,并已有 124 款的收入已突破 100 万美元。

AR/VR 内容与垂直行业充分结合,释放更多商业价值。根据艾瑞咨询,2021 年中国 AR/VR 内容市场规模为 189.3 亿元,其中游戏内容占比最高为 29.9%,约 56.6 亿元,位 列第一。伴随 AR/VR 硬件质量提高、用户渗透率提升等驱动,AR/VR 内容需求也日益增 加,艾瑞咨询预计 2026 年中国 AR/VR 内容市场规模可达 1062.4 亿元。

3)订阅付费:例如 Unity 的创意解决方案(Create solutions)能够提供多层次、全 方位的 3D 引擎工具,采取订阅制的商业模式。针对不同的用户群体,Unity 收取不同的订 阅费用。例如截至 2023 年 12 月,Unity 为学生以及年收入低于 20 万美元的用户提供免 费产品方案;针对年收入高于 20 万美元的用户提供 2040 美元/年的 Unity Pro 产品。辅助 引擎包括 Unity Mars、Unity Refelct 等,则分别计价收费。此外,Unity 更新 Runtime fee 收费模式,将针对 Unity Pro 和 Unity Enterprise 用户,按 2.5%的收入分成或基于唯一初 次互动次数计算的金额进行收费。

4)间接提效:MR 内容能为下游提供更高效的信息传递、更大幅度的效率提升和商 业价值转化。例如,在电商领域,根据京东天工计划 3.0,3D 商品的用户停留时长提升 15.2%,复购率提升 12.8%,有效订单转化率提升 19.2%,退货率降低 15%。在广告营销 领域,根据 2020 年《户外广告内参》,相较于 2D 广告,裸眼 3D 广告的关注度超过 7 倍, 记忆度超过 14 倍,投资回报率达 3.68 倍以上,在提升广告效果和回报率方面具有显著优 势。在工业领域,根据 Gartner,在基于数字孪生的产品智能服务中,维修人员的响应时 间从原来的 300 分钟缩短到了 15 分钟,同时一次性修复率从 75%提升到 92%。

平台支持:操作系统配套演进,交互体验创新升级

操作系统和开发工具配套演进,VisionOS 伴随“空间计算”应运而生。由于 MR 设 备在交互能力、3D 内容呈现、兼容性、隐私安全等方面的独特性,传统的移动端操作系 统难以直接移用,因此针对 MR 设备的操作系统应运而生。根据苹果 WWDC23 全球开发 者大会,库克表示我们已从桌面计算时代、移动计算时代进入空间计算(Spatial Computing) 时代,空间计算指可以参照现实的物理世界构建一个连接虚实场景的数字孪生世界。2023 年6月,搭载全新VisionOS操作系统的Apple Vision Pro亮相。VisionOS以苹果mac-OS、 iOS、iPad-OS 三大系统为基础,是专为“空间计算”设计的首款操作系统。VisionOS 开 发主要基于构建用户界面的 SwiftUI 和 UIKit,显示 3D 内容的 RealityKit,以及解析周围真实世界的 ARKit,开发工具则包括 Xcode、Reality Composer Pro 和 Unity 等,吸引外部 开发者共建软件生态。

内容平台愈渐成熟,内容生态持续扩容。内容方面,根据青亭网统计,截至 2023 年 6 月,SteamVR 共有 7406 款 VR 内容(相比去年同期增加 832 款),其中 VR 独占内容 有 6126 款(相比去年同期增加 658 款);SideQuest 作为 Oculus Quest 的第三方应用商 店已有 6388 款 VR 内容。收入方面,根据 Meta Connect 2023 大会,Meta 透露 Quest Store 游戏和应用创收已超20亿美元。操作系统方面,VisionOS可以兼容macOS、iOS和iPadOS 上的应用程序。根据 Finbold,22Q3 Apple Store 平台上的应用数量共有 164 万款,有望 无缝迁移至 VisionOS,丰富内容生态。

裸手+眼动+语音,MR 内容交互再创新。根据苹果 WWDC23 全球开发者大会,Vision pro 无需借助任何硬件,只需裸手、眼动、语音即可实现交互体验的空间计算互动模式正 式亮相。1)裸手交互,在 Vision pro 中,捏合手指即可选择、轻拂即能滚动,用户双手 放在腿部或沙发上也能实现自然互动;2)眼动跟踪,Vision pro 内置高效眼动跟踪系统, 可以监测用户的眼部行为从而预测点击动作;3)智能语音,用户不仅可以通过听写输入 内容,而且可以通过语音呼唤 Siri 从而打开或关闭 APP 及其他页面。此外,苹果创新开发 Eyesight功能,通过判断用户的沉浸式选择和周围人的状态,选择用户能否与周围人互见。 全景视频的高效生成丰富交互内容。根据《WonderJourney: Going from Anywhere to Everywhere》(Hong-Xing Yu, Haoyi Duan, Junhwa Hur 等),WonderJourney 是一个用 于永久场景生成的模块化框架,结合 3D 场景的几何理解和视觉语义理解,只需一句话或 一张图,即可自动生成一系列 3D 场景的连续全景画面,有望与交互技术相融合。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

评论
  • 相关标签
  • 相关专题
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 没有相关内容
  • 没有相关内容
  • 没有相关内容
  • 全部热门
  • 本年热门
  • 本季热门
  • 没有相关内容
  • 没有相关内容
  • 最新文档
  • 最新精读
分享至