特斯拉引领智驾发展,端到端+大模型加速出行革命。
1.特斯拉引领智驾行业发展
1.1 复盘智驾行业发展,特斯拉起引领作用
回顾智驾发展历程,可分为三个阶段:第一阶段(2007-2016 年)由 Mobileye 主导,采 用纯视觉的黑盒方案,得益于方案成熟且成本低,快速推广,主导 L1、L2 级智驾市场, 但仍存在产品迭代周期长、算力有限、OEM 无自主权等问题;第二阶段(2017-2022 年) 由特斯拉引领 E/E 架构升级,从软硬件解耦、算力提升、通信效率提升等多个维度大幅 提升智能化上限,但该阶段算法仍为 rule based,无法解决 corner case;第三阶段(2023 年以来)特斯拉推出端到端大模型,实现场景泛化及降本,多家车企纷纷跟随。
第一阶段(2007-2016 年):Mobileye 的纯视觉方案引领智驾 L0-L2 级。L2 级及以下(自 适应巡航、车道保持、制动刹车等功能)的自动驾驶市场主要由以色列 ADAS 芯片厂商 Mobileye 主导,巅峰时期 Mobileye 曾占据辅助驾驶市场 90%的份额。公司基于视觉感知算 法,利用摄像头和传感器组合来提供辅助驾驶功能,主要售卖“EyeQ 芯片+感知算法”打包 的黑盒方案,其软硬件耦合方案成本较低,对汽车架构变动有限,车企可短时间迅速部署上 车,备受市场青睐,其客户包含特斯拉、奥迪、宝马、蔚来等全球大型车企。公司 EyeQ 芯 片出货量屡创新高,2015-2021 年 Mobileye 的 ADAS 收入 CAGR 为 34%,是增长最强劲的 ADAS 供应商。但其仍存在局限性,黑盒方案使得车企无法掌握自主权;软硬件耦合使得产 品迭代周期长,无法适应市场快速变化;芯片算力相对有限。
第二阶段(2017-2022 年):特斯拉引领整车 E/E 架构升级,确定行业算法层面技术 路线: E/E 架构从分布式到集中式,大幅提升智能化上限。汽车的电子电气架构决定智能化上 限,而此前分布式架构与 ECU 存在局限性,如 ECU 与线束数量提升成本和车重、无法满 足高算力需求、软硬件耦合掣肘车企且不便于 OTA 升级,因此更加集成化、智能化的域 集中式应运而生。特斯拉则是汽车 E/E 架构升级的引领者,2017 年量产上市的 Model3 便步入了域集中式 E/E 架构,全车“中央计算模块+3 个车身域控制器”。域集中式架构 大幅提升智能化上限:1)智能化升级边际成本降低:域控制器取代大量的 ECU,便于智 能化功能升级,显著降低线束成本;2)OTA 升级难度降低:软硬件解耦,便于 OTA 升 级,实现“软件定义汽车”;3)算力提升:算力向中央集中,统一处理数据,减少算力 冗余,可满足高阶智驾对于算力的高要求;4)通信效率提升:与传统 CAN 总线相比, 以太网有更高的带宽和交换网络,具备更强的通信能力。
特斯拉引领行业算法层面技术路线,车企纷纷跟随: 2021 年 特 斯 拉 推 出 BEV+Transformer(鸟瞰地图),BEV 是一种全新的 3D 坐标系,而 Transformer 则是一 种深度学习神经网络模型,Transformer 算法可以将鸟瞰图在 2D&3D 之间灵活转换,再 导入时间信息,形成基于时序融合的 4D 空间信息,从而使感知结果更加连续、稳定,并 可以解决传统方案的短板问题,例如:记住被汽车遮挡的行人。2022 年推出 Occupancy Network((占用网络),有别于感知 2D-3D 转换,占用网络将世界划分为多个大小一致的 立方体,快速识别每个立方体是否被占用继而判断车辆是否要躲避。国内车企紧随特斯 拉智驾思路,小鹏、理想、蔚来等车企以及毫末智行、百度 Apollo、商汤、地平线等 Tier 1 纷纷跟进,提出自己的 BEV+Transformer 方案。
第三阶段(2023 年以来):特斯拉推出基于端到端大模型的纯视觉方案,实现场景泛化: 2023 年底特斯拉推出端到端大模型。主流自动驾驶系统按照感知、规划、控制三个模块 划分,而特斯拉的端到端大模型将三大模块合为一体,形成大的神经网络,输入传感器 数据后,直接输出转向、制动和加速信号。端到端大模型相较于此前分模块方案的核心 优势在于:1)场景泛化:Rule based 是算法驱动、仍存在长尾问题,但大模型是数据驱 动,通过长尾场景下的训练数据更新模型参数,解决 corner case;2)降低成本:纯视 觉下,外围硬件主要依赖摄像头,激光雷达等传感器逐渐减少,降低硬件成本。国内主 流车企小鹏、理想、蔚来、零跑、小米、比亚迪等均跟随端到端大模型路线。
1.2 类比电动化,特斯拉或带动智驾渗透率快速提升
特斯拉将带动智驾迎来“chatgpt”时刻,L3 及以上渗透率有望迅速提升: 以电动化进程为例,特斯拉兼具产品力与性价比的 Model3 与 ModelY 的上市及其国产化 带动全球电动化浪潮开启,2021-2024,电动车在全球/中国的渗透率分别从 8%/14%到 20%/41%,销量复合增速分别为 40%/54%。 同样的角度来展望智能化历程,特斯拉可实现场景泛化及降本大模型视觉方案具备类似 电动化中“产品力与性价比”的属性,2024 年采用端到端大模型的 FSDV12.3 在美推送;2025 年,特斯拉希望 FSD 能在美国以外市场得到应用许可,扩大消费者使用范围;2026 年 Robotaxi 计划量产。节奏上,我们判断 2024 年为 L3 落地元年,2025 年逐步起量, 2026 年 L3 及以上智驾进入发展快车道,考虑法规层面尚有限制,相较于电动化,智能 化渗透率增长斜率相对更缓。基于弗若斯特沙利文预测,2024-2026 年全球 L4-L5 级渗 透率分别为 0.1%/0.4%/0.9%,2027 年有望提至 2.3%。

2.特斯拉智能化进展领先,大模型技术是核心竞争力
2.1 复盘特斯拉智能化历程:4 代硬件平台+12 代软件算法
特斯拉的智能驾驶系统推进大致分为四大阶段: 1)2016 年之前:发布 HW1.0,采用 Mobileye 打包软硬件全套方案的“黑盒模式”。 2)2016-2017:发布 HW2.0,切换为英伟达,允许自行开发软件系统。 3)2018-2020:FSD 正式开始软硬件全栈自研,推出 HydraNet 感知架构,自研芯片 算力高于同期市面上的其他芯片,停止使用成本较高的毫米波雷达,凭借强算法+高算 力达到毫米波雷达同样的感知效果。 4)2021 年至今:各方面迅速发展。算法方面,2021 年推出 BEV+Transformer(鸟瞰 地图),2022 年推出 Occupancy Network(占用网络),2024 年推出 FSD 正式版;硬件 方面,23Q4 发布 HW4.0;基础设施方面,超算 Dojo 已于 2023 年 7 月投入使用,可以 在无人监管的情况下对大量视频数据进行标注和训练,不断强化特斯拉自动驾驶水平。
从硬件迭代来看,摄像头依赖度提升&其他传感器减配、芯片自研且算力大幅提升领先 行业。HW1.0 主要采用 Mobileye 黑盒方案,2016 年由于事故原因与 Mobileye 终止合作 转向英伟达,算力由 0.256tops 提升至 21tops,摄像头数量增至 8 个;2016 年特斯拉开 始自研芯片,2019 年发布的 HW3.0 搭载双 FSD1.0 芯片,算力提升至 144tops,领先英 伟达;2024Q1,HW4.0 落地,算力大幅提升至 720tops,摄像头数量为 7 个,其画质、 分辨率、视野范围均有提升,减掉超声波雷达;下一代硬件平台 AI5 预计 2025H2 推出, 算力将达到 HW4.0 的 10 倍,或搭载 Robotaxi、人形机器人 Optimus 以及未来支持 L4、 L5 的特斯拉车型。
特斯拉算法迭代思路:图像升维、数据标注自动化、规则驱动转为数据驱动。2016 年特 斯拉开始自研算法,2016-2018 年使用常规骨干网结构,2D 检测器特征提取,数据采用 人工标注,算法相对原始传统;2018-2019 年,引入 Hydranet,实现 Multi-Task learning, 提高效率;2020 年,引入 BEV+Transformer,将图像空间检测目标“Transform”成向量空间,主张去掉雷达,使用纯视觉方案,同时实现自动标注,该阶段主要提高精度; 2021 年,引入 Lanes network,增加了时空序列与时序信息融合等能力,FSD V9、V10 落地;2022 年,引入占用网络,由 2D 图像升维至 3D 立体空间,FSD Beta V10.11 落 地;2024 年,基于端到端大模型的 FSDV12 上车,消除手动规则和代码,运行模型在未 知场景中更好泛化。
2.2 硬件&软件算法奠定智驾能力,工程化落地能力强巩固竞争优势
特斯拉智驾模式流畅丝滑、更类人。FSD 启用场景不设限、FSD 功能全驾驶过程可闭环、 驾驶区域全覆盖、行驶过程基本无断点,使用流畅、体验更类人。 特斯拉智驾领先的核心竞争力在于技术——硬件、软件算法两个维度,均具有极高的技 术壁垒与不可复制性:基于 Transformer 算法的端到端 AI 大模型是核心,高算力芯片及 Dojo 超算中心作为硬件端予以支持辅助。 软件算法层面,Transformer 算法是大模型的底座,其具备可处理长距离依赖关系、计算 效率高、适应性强等优势,因此取代 CNN((积积神经网络)和 RNN((环环神经网络)成 为 NLP(自然语言处理)中的特征提取器。特斯拉及比亚迪、长城、“蔚小理”、塞力斯 等国内主流车企均已采用 Transformer 架构。2022 年底,特斯拉 Autopilot 部门的一位 工程师提议,要借鉴 ChatGPT,让神经网络通过学习人类驾驶员的训练素材,来实现路 径规划,该方案意味着放弃 rule-based,全面转向神经网络,让机器像人一样学习。是 AI 赋能的端到端大模型通过解决长尾问题实现了场景泛化与降本,使 L3 及以上级别智 驾的落地成为可能。
大模型的技术壁垒,体现在模型编写、算力支持、海量数据需求等方面。端到端 AI 大模 型要靠代码实现,模型编写本身难度极高,对研发人员要求高;作为数据驱动的新型自 动驾驶方案,数据采集和标注的体量一定要达到相当的规模才能实施,需要海量的高质 量数据喂养和极高的算力支持。截至 2024 年 12 月,特斯拉 FSD 累计行驶里程突破 25 亿英里(40 亿公里),其中 FSDV12 2024Q1 上线后,累计行驶里程已超 15 亿英里(24 亿公里),相较其他车企智驾行驶里程显著领先,2024 年第四季度,使用 Autopilot 技术 的特斯拉车辆事故间行驶里程 594 万英里,创下第四季度最佳纪录,而美国平均水平为 70 万英里。目前,特斯拉 FSD 部分区域获得许可,后边将进一步扩大地域范围。
硬件层面,特斯拉云端超算平台为大模型提供高算力支持,边缘端 FSD 芯片算力行业领 先: 云端来看,特斯拉算力及资金投入均远高于其他车企。2024 年特斯拉投资约 100 亿美 元,用于训练和推理结合的人工智能,该投资水平远超其他车企。据特斯拉财报,2024Q4 特斯拉在德州工厂完成了约 5 万块 H100 训练集群 Cortex 的部署。特斯拉目前拥有算力 为 100EFLOPS,国内车企现有的算力都在 10 EFLOPS 以下,有些甚至低于 1EFLOPS, 1EFLOPS 是完成端到端智能驾驶的研发和训练的起步算力。 Dojo 超算中心采用自研芯片,预计 24 年底实现 8000 块 H100 等效算力。除了英伟 达 GPU,德州超算集群中还配备了特斯拉 AI4、AI5、Dojo 系统,24 年底 AI4 计算机约 4 万个(与英伟达芯片比为 1:2)。Dojo 超级计算机,搭载自研 AI 芯片 D1,该计算机 于 2023 年 7 月投入生产;到 2024 年 10 月,Dojo1 总算力规模将达到 100Exa-Flops, 到 24 年底上线算力等效 8000 块英伟达 H100。Dojo 有望成为特斯拉的 AI 基础设施, 为特斯拉的自动驾驶、人形机器人、X、SpaceX 等领域提供全方位支持。

边缘端来看,特斯拉自研 FSD 芯片性能行业领先、算力持续提升。2019 年起采用自研 芯片,HW3.0 搭载双 FSD1.0 芯片,使用三星 14nm 工艺,面积仅 260 平方毫米,可实 现 144Tops 算力,而英伟达 Xavier 使用台积电 12nm 工艺,面积 350 平方毫米,算力 仅 30TOPS,特斯拉自研芯片性能行业领先。目前,HW4.0 平台搭载双 FSD2.0 芯片,算 力达 720Tops,单颗芯片算力 360Tops,高于英伟达 Orin-x(254Tops);AI5 硬件平台 下,算力 10 倍于 HW4.0,预计芯片算力将有大幅提升。
除软件算法及硬件外,特斯拉工程化落地能力强。在后续技术路线、算法等逐步趋同的 情况下,考验的将是车企工程化落地能力,包括功能安全设计、人机交互设计,以及算 法如何解决漏检误检、控制顿挫,如何避免规划失败、决策错误等。特斯拉工程化落地 能力强,各场景下表现持续优化,其中安全转弯、交叉路口、停靠校车等场景下驾驶流 畅度提升显著。
2.3 特斯拉智能化进展领先,Robotaxi、FSD 值得期待
特斯拉 FSD 有望逐步扩展到世界其他地区,相较国内车企布局领先。特斯拉的自动驾驶 产品主要有三个类别:AP((自动辅助驾驶)、EAP((增强辅助驾驶)、FSD((全自动驾驶)。 其中,AP 是自动辅助驾驶,是特斯拉的免费标配;EAP 为增强辅助驾驶,在 AP 基础上, 增加了智能机召唤,自动泊车、高速 NOA 等功能,目前在中国地区售价为 3.2 万元;而 FSD 主要功能包括导航辅助驾驶((NOA)、自动变道、自动泊车、智能召唤、交通信号识 别、(基于导航路线的)城市道路自动转向等,目前美国全域可实现,25 年有望拓展至 全球更大范围应用。国内车企蔚小理、小米及搭载华为 ADS 系统的车企均已实现全国高 速 NOA,城市 NOA 落地速度有差异,小鹏、华为、理想已实现全国全量推送城市 NOA, 其他车企城市 NOA 进度相对较缓。此外,特斯拉 Robotaxi 有望 2026 年实现量产,预计 2025 年在德州和加州向公众提供广泛服务。