2023年自动驾驶行业专题分析:十年磨一剑,FSD迎来快速列装期

  • 来源:国泰君安证券
  • 发布时间:2023/12/06
  • 浏览次数:421
  • 举报

1. 特斯拉自动驾驶软硬件系统持续进化

历经十年,特斯拉自动驾驶软硬件系统不断进化。2013 年,马斯克于推 特披露特斯拉正在进行辅助驾驶系统 AP(Autopilot System)的研发, 特斯拉自动驾驶之路开启;2014 年 10 月,特斯拉基于与 Mobileye 的深 度合作,推出首款自动驾驶软硬件系统 HW 1.0 与 AP1.0;2015 年 4 月, 特斯拉组建软件算法小组 Vision,算法开发由第三方供应转向自研;2016 年 7 月,特斯拉宣布结束与 Mobileye 的合作;2016 年 10 月,特斯拉自 动驾驶软硬件系统 HW 2.0 与 AP2.0 发布,计算平台基于英伟达 Drive PX 2;2017 年 8 月,特斯拉将 HW 2.0 更新升级为 HW 2.5,底层算力与冗 余能力均有提升。2019年3月,特斯拉推出基于自研芯片FSD 的 HW 3.0, 其为特斯拉发布的首个支持完全自动驾驶 FSD(Full Self-Driving)功能 的硬件系统;2020 年 10 月,特斯拉向小批量早期测试者推送 FSD Beta V6.0 版本,FSD 功能首上车;2022 年 11 月,FSD 功能全面向北美用户 开放。目前特斯拉在研的最新自动驾驶硬件系统已迭代至 HW 4.0,搭载 FSD 二代芯片,FSD 经过多次进化即将升级至 Beta V12.0 版本(已开放 员工推送),预计不久的将来两者将正式对外发布。

1.1. 硬件:HW1.0 到 HW4.0,自研比例与配置性能不断提升

HW1.0:依赖于 Mobileye 视觉算法与底层芯片。特斯拉首代自动驾驶 硬件系统 HW1.0 基于 Mobileye 单芯片 EyeQ3 计算平台,算力为 0.256TOPS,系统配套组件包括:1).1 个 Mobileye EQ3 系列前置单目 摄像头,布置于后视镜附近;2).1 个博世 77G Hz 毫米波雷达,最远探 测距离 160 米;3).12 个中程超声波传感器,最远探测距离 5 米;4.) 高精度电子辅助制动与转向系统。特斯拉 HW1.0 基于与 Mobileye 的深 度合作,其中底层芯片与视觉算法技术均来自于 Mobileye,特斯拉仅负 责多传感器融合与应用层软件开发。2014 年-2016 年期间,HW1.0 先后 列装于 Model S 与 Model X 车型。

HW2.0:基于定制的英伟达计算平台 Drive PX 2。特斯拉第二代自动驾 驶硬件系统 HW2.0 基于定制的英伟达 Drive PX 2 计算平台,算力约为 HW1.0 的 40 倍,达到 12TOPS。配套组件方面,HW2.0 搭载 8 个可实 现 360 度环视视角的 120 万像素摄像头,包括 1 个前视三目摄像头,2 个后视侧面摄像头,2 个前视侧面摄像头,1 个后视摄像头,供应商为 Aptina。此外,HW2.0 与 HW1.0 一样,同样配置了 1 个博世 77G Hz 毫 米波雷达与 12 个超声波传感器(由中程升级为远程)。HW2.0 由特斯拉 与英伟达共同开发,其中英伟达提供计算平台与开发工具,特斯拉负责 图像识别算法、多传感器融合与应用层软件开发等工作。2016 年 10 月 起,特斯拉售出的所有汽车均有配置 HW2.0。

英伟达 Drive PX 2 计算平台:2015 年 1 月英伟达推出(半)自动驾驶 汽车的初始开发平台 Drive PX;2016 年 1 月英伟达在 CES 上推出了增 强版 Drive PX 2,该平台基于通用的 GPU 架构,可实现卷积神经网络 (CNN)的应用。

为实现自动驾驶性能的进一步提升,特斯拉开始自研 FSD 芯片。尽管 英伟达 Drive PX 2 计算平台在当时的自动驾驶领域已处于领先地位,但 特斯拉仍认为其基于通用 GPU 架构的设计并不能最大限度满足自动驾 驶功能需求,系统运行速度还可以通过设计优化进行提升。因此,2016 年特斯拉在发布 HW2.0 的同时开始了 FSD 自研芯片的开发,并陆续从 AMD 引入大量芯片人才。 HW2.5:冗余性与可靠性获得提升。2017 年 7 月特斯拉对 HW2.0 进行 更新,业内称更新版本为 HW2.5。该次更新主要对系统的冗余性与可靠 性进行了提升,并新增行车记录仪与哨兵模式功能。具体组件变动为: 1).前置/侧置摄像头从 RCCC 滤镜换成了 RCCB 滤镜,摄像头的色彩分 辨能力提升。2).毫米波雷达由博世 77G Hz 中距离雷达替换为大陆长距 离雷达 ARS410。3).计算平台增加了 1 个 Parker 处理芯片。4).采用了 双线缆通信使线控系统冗余性增强。

HW3.0:首次采用自研芯片,支持 FSD 功能实现。特斯拉 HW3.0 又称 FSD Computer,其抛弃了 HW2.5 的英伟达/英飞凌(SOC+MCU)底层 芯片组合,转为装载自研 FSD 芯片。与 HW2.5 相比,HW3.0 在性能和 成本上都有较大提升,可支持 FSD 功能。根据特斯拉数据,FSD 算力 达到 144TOPS,每秒可处理图片 2300 张,而 HW 2.5 每秒处理能力仅为 110 张,性能提升 21 倍;FSD 的成本相对于 HW 2.5 下降了 20%。配套 组件方面,HW3.0 与 HW2.5 完全一致,仍采用 8 个可环视摄像头+1 个 大陆毫米波雷达+12 个超声波传感器方案。结构布局方面,HW3.0 将驾 驶辅助硬件和娱乐系统硬件集成在同一控制器中,但电路设计未实现高 度集成,两项功能分别基于独立的电路板。在 HW3.0 研发过程中,特斯拉负责了全套芯片设计、图像识别算法、多传感器融合与应用层软件开 发等多项工作,自研比例再次提升。

FSD 芯片:FSD 芯片采用三星 14nm FinFET CMOS 工艺,在 260mm2 的硅片上集成了约 60 亿个晶体管,组成 2.5 亿个逻辑门电路,芯片封装 尺寸 37.5×37.5mm,底座采用 FCBGA 设计,整体设计符合 AEC-Q100 汽车质量标准。FSD 芯片主要由 CPU、GPU 和 NNA(神经网络加速单 元)三个计算模块,以及各种接口,片上网络等组成,其中 CPU 由三组 四核 ARM Cortex-A72 架构组成,主频 2.2GHz,主要用于通用的计算和 任务,GPU 支持 16/32 位浮点运算,算力为 600GFlops,主要用于轻量 级的后处理任务,NNA 包括 2 个 NPU(神经网络处理器),每个 NPU 都封装了 32MB 的 SRAM。HW3.0 中搭载了两颗 FSD 芯片,在行驶过 程中,两颗芯片将分别对传感器收集到的数据进行独立处理,并进行结 果平衡、仲裁和验证,自动驾驶功能的可靠性得到提升。

HW4.0:即将发布,配置将有较大升级。根据外媒拆解报告,HW4.0 采 用 FSD 二代芯片,预计算力高于 300TOPS,内部 CPU 的内核从 12 个增 加到 20 个,最大频率为 2.35GHz,低功耗频率为 1.37GHz;TRIP 内核 数量从 2 个增加到 3 个,最大频率 2.2GHz。配套组件方面,HW4.0 的 主板摄像头接口为 12 个,其中 1 个为备用,即车载摄像头或由原先的 8 个提升至 11 个,前置摄像头像素也有望提升至 500 万。此外,HW4.0 主板增加了 4D 毫米波雷达接口(代号 Phoenix),但未配置超声波雷达。

1.2. 软件:Autopilot 共有三款产品,对应不同售价与功能

目前特斯拉自动驾驶软件 Autopilot 共有三款产品,对应不同售价与功能, 分别为 BAP(基础版辅助驾驶), EAP(增强版辅助驾驶),FSD(完全 自动驾驶)。 BAP(Basic Autopilot):该自动驾驶软件为特斯拉车型标配,包括自适 应巡航和车道保持功能。 EAP(Enhanced Autopilot):在 BAP 功能基础上增加了打灯自动变道、 高速 NOA、智能召唤和自动泊车等功能,非车型标配,购买方式为一次 性购买,美国售价 6000 美元,国内售价 3.2 万元。 FSD(Full Self-Driving):特斯拉为实现完全自动驾驶提供的增值软件 产品,目前 FSD 尚未达到完全自动驾驶,但未来将通过 OTA 升级逐步 实现。目前 FSD 仍处于测试 Beta 版本,现有功能包括 EAP 智驾功能与信号灯识别、市区高速领航 NOA 等。FSD 购买方式有订阅(仅适应于 美国地区)与一次性购买两种,其中订阅费用为 199 美元/月(未购买 EAP)与 99 美元/月(已购买 EAP),一次性购买费用为 1.2 万美元,国 内售价 6.4 万元。当前国内地区虽可以购买 FSD,但无法使用全部功能 (仅 EAP 智驾功能可用),预计 FSD 在不久的将来落地国内。

FSD 在法律层面仍属于 L2+级辅助驾驶,驾驶员将承担主要事故责任。 美国国家公路交通安全管理局(NHTSA)认为特斯拉 Autopilot 与 FSD 并不是完全自动驾驶技术,而属于驾驶员辅助系统,因其操作细则上明 确表示驾驶员需要将双手放在方向盘上,眼睛需始终盯向路面。因此目 前特斯拉汽车在美国发生交通事故时驾驶员仍将承担主要事故责任。

1.2.1. 由 AP 到 FSD,完全自动驾驶技术愈发成熟

AP1.0:特斯拉首款自动驾驶软件。2014 年 10 月,AP1.0 与 HW1.0 一同 上车,其核心视觉算法来自于 Mobileye,智能驾驶等级为 L2,具备 OTA 持续升级能力。2014 年-2016 年期间,特斯拉 AP1.0 不断进化,先后增 加车道保持、速度提示、自适应巡航、防碰撞预警、自动转向、侧方位 泊车、自动出库等功能。

与 Mobileye 分道扬镳,特斯拉自研之路开启。经过一段时间合作,特 斯拉逐渐意识到 Mobileye 的算法十分依赖于自身拥有的行车大数据,而 Mobileye 却无法满足特斯拉对于自动驾驶算法快速迭代的要求,这就使 得特斯拉进行算法自研的意愿愈发强烈。2015 年 4 月,特斯拉组建软件 算法小组 Vision,自此开始积累算法自研经验。2016 年 5 月,美国加利 福尼亚州一辆开启 Autopilot 的特斯拉 Model S 发生交通事故,特斯拉与 Mobileye 对于事故责任的认定产生争执,进而成为两者合作破裂的导火 索。2016 年 7 月,特斯拉宣布结束与 Mobileye 的合作。

AP2.0:早期效果较差,但后续通过多次更新实现优化。随着 2016 年 HW2.0 问世,特斯拉自研的 AP2.0 同步发布。因结束与 Mobileye 合作,且特斯拉视觉感知技术尚不成熟,起初 AP2.0 的体验效果弱于 AP1.0, 但随 2017 年特斯拉对 AP2.0 进行了 8.1 版本重大更新,AP2.0 增加了十 多个主动安全类功能,车辆控制也更加平滑,AP2.0 的体验效果开始逐 步优于 AP1.0。 伴随着 AP2.0 的推出,特斯拉也同步发布了增值服务增强版自动辅助驾 驶包(EAP)与完全自动驾驶包(FSD),软硬分离的自动驾驶收费模式 确立。其中 FSD 因尚未开发完成,处于期权状态。

特斯拉前期算法基于传统神经网络 RNN 和 CNN,采用单 Head 架构, 多任务运行效率低。早期的自动驾驶算法基于传统神经网络 RNN 和 CNN,遵循 Input-Backbone-Neck-Head-Output 的运行逻辑,其中主干网 络 Backbone 为特征提取网络,主要用于识别图像中的多个对象,Neck 主要负责提取更为精细的特征,Head 则是在特征提取后进行检测,提供 输入的特征图表示,比如检测对象,实例分割等。在发展早期,视觉神 经网络通常只有一个 Head,这就导致算法完成多项任务时效率较低,例 如在车辆行驶过程中或面临车道线检测、人物检测与追踪、信号灯检测 同时进行的情况,而传统网络架构算法很难做到高效处理。

特斯拉前期算法采用 IPM+CNN/RNN 技术实现 3D 感知,精确度较差。 传统摄像头收集到的数据是 2D 图像,但自动驾驶车辆面对的现实世界 是 3D 的,因此需将 2D 图像数据通过模型分析融合后升维至 3D,以赋 予自动驾驶车辆更可靠的感知能力。对此,行业里早期的处理方式为采 用 CNN/RNN+IPM 技术实现 3D 视角绘制,但此方案对于成像环境的要 求较高,且 CNN+RNN 神经网络下的 2D 至 3D 数据处理精度较差,经 常导致转换出来的 3D 场景与实际场景失真。

特斯拉前期训练依靠人工标注。行业内早期的自动驾驶数据挖掘基于规 则或监督学习,多采用人工标注方式,存在成本高,精度差,一致性低 等问题。特斯拉早期标注方式为委托第三方公司进行人工标注,后成立 自建标注团队,成员人数最高超过 1000 人。 2018 年特斯拉推出 HydraNet(九头蛇)多任务神经网络架构,运行效 率提升。HydraNet 系特斯拉研发的多任务学习神经网络架构,属于 Multi-Head 架构,多 Head 的布局使算法具备了多头任务处理能力。此 外,HydraNet 能够减少重复的卷积计算,减少主干网络计算数量,还能 够将特定任务从主干中解耦出来,进行单独微调,算法运行效率大幅提 升。

FSD:特斯拉早于 2015 年便着手 FSD 功能的实现,2016 年 FSD 作为特 斯拉 EAP 增值服务进行预售,2017 年 FSD 芯片设计完成。2019 年 3 月, 特斯拉推出基于自研芯片 FSD 的 HW 3.0,为 FSD 功能的实现提供了硬 件基础。2019 年 4 月,特斯拉将 FSD 以单独的功能进行出售。除硬件 方面,FSD 功能的实现也需要依托算法的进化,但 2020 年前,特斯拉 基于传统神经网络的算法能力并不出众,感知问题频出,特斯拉完全自 动驾驶的实现遇到了较大阻碍。

2020 年特斯拉对 FSD 底层软件与训练方式进行重构,算法性能迎来质 变。2020 年 8 月,马斯克在推特上发文称,Autopilot 团队正对软件的 底层代码进行重写和深度神经网络重构。2021年与2022年特斯拉AI Day 上 AP 团队陆续披露了相关重大突破与进展,其中主要包括:1).2020 年数据由人工标注转向自动标注;2).2021 年引入 BEV+Transformer 大 模型;3).2021 年引入时序数据;4).2022 年引入占用网络技术;5.) 2022 年发布超级计算机 Dojo。 1.BEV+Transformer 大模型使搭建高精度 3D 感知模型成为可能。2021 年特斯拉发布基于 BEV+Transformer 的感知算法架构。BEV 即鸟瞰图, BEV 感知策略的实现方式是通过多个摄像头(或辅以激光雷达、毫米波 雷达等)获得全方位视角图像,再通过共享 2D 特征提取器对不同摄像 头获取的画面进行重建、拼接,最终形成 3D 全局视角。与传统 IPM 技 术下的后融合策略不同,BEV 感知策略借用统一的 BEV 空间实现了特 征级融合,数据失真率低,感知准确率更强。Transformer 是一种基于自 注意力的深度学习模型,该模型并不像 CNN+RNN 通过串行顺序处理数 据,而是通过自注意力集中机制捕捉序列中不同元素的相关性,更适应 BEV 感知下的数据融合与处理。

基于 BEV与 Transformer的深度学习能赋予 FSD更强的 3D感知能力, 并可摆脱对高精地图的依赖。具体实现方式为:通过多个摄像头形成环 视图像,并在 BEV 空间内初始化特征,再通过多层 Transformer 和 2D 特征进行交互融合,最终实现 BEV 特征。BEV 与 Transformer 结构使高 准确率的 3D 视角成像成为可能,大幅提升了 FSD 的感知能力。此外, 通过 BEV 空间的搭建可以形成以车为中心的坐标系,实时绘制出高精 度空间地图,再结合众包模式实现遮挡缺失道路信息补齐,FSD 便可摆 脱对高精地图的依赖。

2. 时序数据为 FSD 增加了“记忆”,可用于预测遮挡信息等。2021 年 特斯拉在 BEV 感知模型中加入 Video Netural Net,引入时序数据。引入 时序数据后,FSD 算法将使用视频片段,而不是图像来训练神经网络, 因此可以通过先前时间段的数据特征推算当前场景下可能性最大的结 果,进而解决遮挡物体运动预测、交通指示牌记忆等问题。

3.引入占用网络使感知算法的泛化能力大幅提升。2022 年特斯拉引入占 用网络对 BEV 感知进行了升级。传统自动驾驶算法依照先识别判断, 后决策的运行逻辑处理障碍物,这就导致在面对未训练过的物体出现时, 算法无法进行有效检测。相比之下,占用网路技术(Occupancy)仅通 过体素(3D 图像体素对应 2D 图像像素点)概念判断空间是否被占用,而 并不去识别障碍物是什么、这就显著增强了 FSD 的感知泛化能力,使 FSD 应对 Corner case 时更加得心应手。

4.自动标注显著提升了数据处理速度与精度,成本大幅下降。2020 年特 斯拉研发并使用了数据自动标注系统,其原理为将车辆收集到的路面信 息打包上传至服务器,由大模型进行预测性标注后反馈到车端传感器, 由于传感器视角不同,当预测标注结果在所有传感器均一致时自动标注 成功。特斯拉通过大模型预训练方式的自动标注大幅提高了标注效率, 成本也显著降低。

5. 超级计算机 Dojo 充分应用大量行车数据。2022 年特斯拉发布超级 计算机 Dojo,其主要功能为利用海量的数据,做无人监管的自动标注和 仿真训练。Dojo 基于特斯拉自研的 AI 训练芯片 D1,该芯片采用了 7nm 工艺制程,拥有 500 亿个晶体管和 354 个训练节点。Dojo 内部共由 25 颗 D1 芯片组成,可以提供高达 36TB/s 的带宽和 9PetaFLOPS 的算力。 2023 年 7 月,Dojo 进入投产阶段。预计未来 Dojo 将凭借高算力、高稳 定性、高拓展力等特点帮助特斯拉 FSD 实现高效的自动标注和仿真训练, 算法迭代加速。

移除毫米波/超声波雷达,走向纯视觉方案。2021 年 5 月与 2022 年 10 月,特斯拉先后从车辆配置中移除毫米波雷达与超声波传感器,正式走 上纯视觉方案,其主要原因为特斯拉认为既然人类能够利用眼睛和大脑 驾驶汽车,那么只要给汽车配置相应性能的视觉设备与运算系统,汽车 自动驾驶能力就不会弱于人类驾驶员。此外,纯视觉方案大幅降低了自 动驾驶硬件的成本,有助于实现更好的销量,而销量的提升将帮助特斯 拉收集到更多行车数据,算法迭代速度提升,进而使特斯拉迅速取得自 动驾驶行业领先地位。

FSD 发布以来功能持续丰富,V12 发布在即。随着硬件层面的背书,算 法层面的不断革新,FSD 自发布以来成熟度不断提升,功能逐渐丰富。 自2020年10月特斯拉首次向小批量早期测试者推送 FSD Beta V6.0起, 特斯拉 FSD 历经了多次版本更新,目前最新版本 FSD Beta V12 已向特 斯拉内部员工开启推送,预计其将在不久的将来正式发布。

FSD V12 将完全实现端到端大模型,车辆行驶将更具拟人化。2022 年 5 月马斯克称 FSD V12 版本将完全实现端到端。端到端大模型是将传统 自动驾驶算法的感知、决策规划、控制等环节融合的一体化模型,其能 把传感器收集到的信息直接输入到统一的深度学习神经网络中,处理后 直接生成驾驶命令。端到端方案用一个大模型实现了原先模块化架构下 多个小模型的功能,一方面避免了原先多模块下“流水线”工作导致的 误差累积,另一方面,端到端模型能做到更好地集中资源,实现功能聚 焦,因为研发人员仅需对一个模型进行训练与优化即可,省去了大量繁 琐工作。与现版本相比,基于实现完全端到端的 FSDV12 消除了超过 30 万条控制车辆 FSD 功能的代码,并首次通过神经网络控制转向、加速和 制动。FSD V12 的决策将在黑盒状态下进行,这与人脑的运行机制更为 贴近,驾驶决策行为将更具拟人性。我们预计 FSD V12 版本的运算速度 与安全性将较以往显著提升。

FSD 北美渗透率预计已突破 25%。截止 2022 年 Q3,特斯拉 FSD 全球渗透率约为 7.4%,其中北美地区渗透率最高,达到 14.3%,截止 2023 年 1 月,特斯拉北美地区用户数量突破 40 万,较 2022 年 12 月的 28.5 万提升了近 40%,截止 2022 年底,特斯拉北美地区累计销量约为 152 万辆,以此推算出特斯拉 FSD 北美地区渗透率已突破 25%。FSD 在不 同车型上的渗透率差别较大,截止 2022 年 Q3,高价车型 Model S/X 的 FSD 渗透率已接近 45%,而 Model 3/Y 的 FSD 渗透率仅为 3.1%/6.5%, 预计主要原因为 Model S/X 车主通常较 Model 3/Y 车主更富有,且多为 特斯拉忠实用户,因此更愿意为额外的 FSD 增值服务买单。

FSD 技术将延伸应用至特斯拉人形机器人 Optimus。2021 年 8 月,特斯 拉在 AI 日上发布人形机器人概念图及视频,宣布特斯拉通用机器人计 划。2022 年 9 月 AI 日特斯拉 Optimus 原型机首次现身,特斯拉人形机 器人正加速推进。与自动驾驶汽车一样,人型机器人同样需要具备环境 感知、道路规划、障碍物躲避等能力,FSD 技术的深厚积累将帮助特斯 拉在人形机器人领域建立领先优势。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至