2026年汽车与汽车零部件行业智驾平权系列六:AI智能涌现新阶段,智驾VLA与世界模型之争
- 来源:长江证券
- 发布时间:2026/02/27
- 浏览次数:82
- 举报
汽车与汽车零部件行业智驾平权系列六:AI智能涌现新阶段,智驾VLA与世界模型之争.pdf
汽车与汽车零部件行业智驾平权系列六:AI智能涌现新阶段,智驾VLA与世界模型之争。引言:AI赋能,智驾进入大模型时代通用人工智能大模型迎来跨越式发展,模型规模、训练范式与推理能力持续突破,为各类AI应用构建了坚实的底层技术底座。智能驾驶本质是“物理AI”的应用,大模型底座技术迭代加速智驾驾驶持续升级。通用大模型能力涌现,赋能智驾模型基座,智驾模型架构持续进阶,逐步进入VLA和世界模型的物理AI时代,迈向智能涌现新阶段。通用大模型能力“涌现”,铸就AI应用底层支撑AI大模型时代,以Transformer架构为技术基底,依托算力的指数级提升与海量多模...
引言:AI 赋能,智驾进入大模型时代
通用人工智能大模型迎来跨越式发展,模型规模、训练范式与推理能力持续突破。以 Transformer 架构为技术基底,依托算力的指数级提升与海量多模态数据的积累,大语 言模型实现了从单一语言理解到多模态融合、从专用任务适配到通用能力涌现的关键突 破,为各类 AI 应用构建了坚实的底层技术底座。

智能驾驶本质是“物理 AI”的应用,大模型底座技术迭代加速智能驾驶持续升级。通用 大模型能力涌现,赋能智驾模型基座,智驾大模型进阶,迈向智能涌现新阶段。智驾本 质是将人工智能的感知、决策、规划能力,深度嵌入真实物理世界的动态环境中,通过 与物理世界的实时交互完成任务,所有 AI 决策最终都要转化为物理动作并承受物理规 律的约束与检验。随着智驾从辅助驾驶向无人驾驶升级,算法技术端逐渐从规则时代到 端到端大模型时代,同时引入多模态大语言模型和强化学习,模型架构持续进阶,逐步 进入 VLA 和世界模型的物理 AI 时代。
通用大模型能力“涌现”,铸就 AI 应用底层支撑
AI 大模型时代,以 Transformer 架构为技术基底,依托算力的指数级提升与海量多模 态数据的积累,大模型实现了从单一语言理解到多模态融合、从专用任务适配到通用能 力涌现的关键突破,推动 AI 模型的商业化落地。从分类角度来看,AI 领域大模型覆盖 自然语言处理、计算机视觉、多模态交互等核心方向,清晰区分不同维度下大模型的技 术特征、代表模型与应用场景。按照输入模态,大模型可分为语言大模型、视觉大模型、 语音大模型和多模态大模型等;按照模型架构,可分为卷积神经网络(CNN)、循环神 经网络(RNN)、生成对抗网络(GAN)和 Transformer 架构等。
从当前行业趋势来看,大语言模型+Transformer 的模型组合是主流,同时逐步进化到 多模态大模型和推理模型。大语言模型(Large Language Model,LLM)是基于 Transformer 架构构建、通过海量文本数据进行无监督预训练得到的大参数量人工智能 模型,核心具备对自然语言的理解、生成、推理、翻译等综合能力,能捕捉语言的语义、 语法、逻辑及知识关联,适配各类自然语言处理任务,是大模型时代自然语言处理领域 的核心基础模型。 大型语言模型自 2017 年 Transformer 架构问世,至 2025 年 DeepSeek-R1 推出,历 经 BERT、GPT 系列等核心模型迭代,及多模态、推理模型的关键突破,在规模、性 能、成本与多模态能力上实现跨越式发展,出现了多轮能力跃迁。
从预训练到后训练对齐,进入“ChatGPT 时刻”
预训练规模化突破,参数跃迁带来模型能力提升,同时后训练引入监督微调和强化学习, 进入“ChatGPT 时刻”。2017 年大模型引入 Transformer 架构,为构建能够高精确性 和灵活性处理复杂任务的大规模高效语言模型奠定了基础。同时,GPT 模型引入展示了 自回归架构和生成能力的强大功能,同时 Scaling Law 显现,强调了规模、数据和计算 在实现最先进结果中的重要性,大模型能力进一步提升。GPT 模型从第一代迭代至 GPT3,模型参数量提升至 1750 亿,表明随着模型规模的增长,模型在捕捉复杂模式和泛化 到新任务方面变得更好:1)数据集大小:更大的模型需要庞大的数据集进行预训练; 2)计算资源:强大的硬件(如 GPU 和 TPU)的可用性以及分布式训练技术,使得高效 训练具有数十亿参数的模型成为可能;3)高效架构:混合精度训练和梯度检查点等创 新降低了计算成本,使得在合理的时间和预算内进行大规模训练更加实际。

后训练引入监督微调和强化学习,进一步提升模型能力,提升与人类意图的一致性并减 少幻觉(Hallucination)。大模型幻觉是指 LLM 生成与事实不符、无意义或与输入提示矛盾的内容,类似于“一本正经地胡说八道”。2021-2022 年阶段模型训练中引入监督 微调(SFT)和基于人类反馈的强化学习(RLHF)等技术,使模型不仅能够准确遵循指 令,还能适应新任务并持续改进。通过将人类反馈整合到训练循环中,RLHF 显著增强 了模型生成可靠、符合人类输出的能力,为 AI 对齐和性能设定了新标准。同时,OpenAI 于 2022 年 11 月推出了 ChatGPT,这是一种突破性的对话式 AI 模型,专门为自然的多 轮对话进行了微调。
模型推理能力飞跃,进入 Agent 时代,AI 应用进入重 要拐点
推理能力飞跃,大模型技术从“参数驱动”向“能力驱动”跃迁。多模态大型语言模型 (MLLMs)引入,通过将文本、图像、音频和视频整合到统一系统中,扩展了传统语言 模型的能力,实现了更丰富的交互和更复杂的问题解决。MLLMs 革新了医疗保健(诊 断)、教育(互动学习)、自动驾驶和创意产业(多媒体制作)等领域,处理多种模态的 能力提升了模型应用范围和能力上限,例如 GPT-4V 和 GPT-4o。 AI 模型开发开始强调提升推理(Reasoning),从简单的模式识别转向更逻辑化和结构化 的思维过程。推理模型采用“长链思维”,大幅提升模型解决复杂推理任务能力。2024 年 9 月 12 日 OpenAI 发布的 o1-preview,采用了“长链思维”(Long CoT),即内部的 推理轨迹,使模型能够通过分解问题、批判自己的解决方案并探索替代方案来“思考” 问题。
AI 应用商业化落地拐点开始于 2024 年 Q3,本质是模型推理能力飞跃,引入 Agent 模 式,实现功能体验的质变。2024 年 9 月,OpenAI 发布首个推理模型 o1-preview, 实现推理能力一大飞跃,真正奠定了本轮周期下产品化的拐点。其核心理念是,模型在 生成最终答案之前,花费额外的计算资源来生成一段内部的思考链(CoT,chain of thought),使其能够将复杂问题分解为更小、更易管理的步骤,从而在需要逻辑、数学 和规划的复杂任务上实现性能的巨大飞跃。这标志着模型从静态的知识检索向动态的问 题解决能力的演进。
从 o 系列推理模型开始,大模型实现对工作流步骤的反复思考、拆解、理解、推理, 本轮技术进步标志着 Agent 产品化探索落地的开始。o 系列是本轮技术周期下产品化 拐点的基础主要由两点导致:第一,在 o 系列之前基础模型能力不足以实现产品化; 第二,过往已有的 Copilot 模式不具备产品化和商业化属性,Agent 才是破局之道。 此前模型能力不足。推理范式的兴起意味着 AI Agent 落地的可能,核心在于其从简单 的模式识别转向更逻辑化和结构化的思维过程。过去,单纯基于 LLM 的 Chatbot 只是 能简单地回答用户问题,但这并不是 AI 与人类交互的终极形式,世界所需要的是 AI 能够为用户解决真实世界的问题,这需要一套完善的执行系统完成交付,AI Agent 因其 泛用性和实用性很可能成为产品端破局的关键。

成本高效推理模型及开源,AI 进入“DeepSeek”时刻
DeepSeek-R1 代表了成本效率的大飞跃,利用专家混合架构(MoE)和优化算法,与许 多美国模型相比,运营成本大幅降低。2025 年 1 月下旬,DeepSeek 发布 DeepSeekR1-Zero 和 DeepSeek-R1,展示了卓越的推理能力和极低的训练成本。DeepSeek-R1 纳入了一组有限的高质量冷启动数据和额外的 RL 训练,模型经历了多个微调和 RL 阶 段,包括拒绝采样和第二轮 RL 训练,以提高其通用能力和与人类偏好的一致性。 DeepSeek-R1 利用先进的强化学习技术,这些模型证明了高性能推理可以在没有通常 与尖端 AI 相关的巨额计算费用的情况下实现。 DeepSeek 开源性质加速尖端 AI 应用的普及化,赋予各行业创新者权利,并强调了可 扩展性、对齐性和可访问性在塑造 AI 未来中的重要性。
大模型底座技术迭代,加速智驾算法持续升级
通用人工智能大模型迎来跨越式发展,模型规模、训练范式与推理能力持续突破,加速 智能驾驶大模型迭代。智能驾驶从 2023 年开始,特斯拉 FSD V12 引领,进入到“端到 端”大模型时代,大模型时代智驾参数量大幅提升,在车端的模型参数规模普遍已经达 到数十亿参数门槛,云端模型参数规模达到百亿级别,Scaling Law 持续在智驾中体现。 同时引入多模态大语言模型,“端到端”模型向 VLA 范式演进,加强模型在多模态的理 解能力,提升深度推理与决策的能力,逐步具备长思维链(CoT)能力,进一步提升泛 化能力和增强模型动作的可解释性。在模型训练方面,借鉴 DeepSeek 训练方式优点, 强化学习逐步迁移应用至端到端智能驾驶领域,借助多阶段强化学习训练机制,提升模 型训练效率和降低训练成本,使模型规模扩展的 "规模定律(Scaling laws)" 持续显现。
智驾大模型进阶,迈向智能涌现新阶段
从规则时代到大模型时代,“端到端”智能驾驶借助大规模高质量人类驾驶数据实现驾 驶行为的模仿,帮助智驾摆脱规则限制,叠加 Scaling laws,实现初代的泛化性能,但 初代“端到端”模型,一方面,模仿学习模式虽可趋近人类驾驶水平,但难以突破人类 能力的上限,同时受到高质量场景数据的稀缺性与驾驶数据质量的不均衡性的影响;另 一方面,“端到端”模型偏“黑盒”的方式也使得模型训练、调整、问题溯源成为难点。 随着 DeepSeek-R1 模型基于纯强化学习的创新技术路径展现出独特优势,强化学习逐 步迁移应用至端到端智能驾驶领域,借助多阶段强化学习训练机制,提升模型训练效率 和降低训练成本,使模型规模扩展的 "规模定律(Scaling laws)" 持续显现。同时引入 多模态大语言模型,“端到端”模型向 VLA 范式演进,加强模型在多模态的理解能力, 提升深度推理与决策的能力,逐步具备长思维链(CoT)能力,进一步提升泛化能力和 增强模型动作的可解释性,甚至展现出超越人类思维局限的潜力。同时,“端到端”智驾 模型通过与世界模型生成的仿真环境进行互动,可以使模型对真实世界的物理规则拥有 更深的理解,智能驾驶逐步进入物理 AI 时代,迈向智能涌现。
特斯拉引领,智驾大模型进入“端到端”时代
自动驾驶经历从规则模型走向端到端大模型,并逐步向 VLA 和世界模型演进。回顾自 动驾驶的发展历程,特斯拉从早期的神经网络 Hydra Net,到引入 BEV + Transformer, 实现感知端到端,再到转向全面“端到端”大模型,在智驾算法方面持续引领。 特斯拉引领,自动驾驶架构的历史演进主要经历四个主要阶段,当前智驾已经演进到 VLA 和世界大模型时代。1)第一阶段:感知层面大模型引入,形成感知“端到端”,决 策段主要采用规则方式;2)第二阶段:决策规划模型化,预测、决策、规划的功能模块 逐渐集成到同一个神经网络模型,但是感知和预测决策规划仍然被分成两个主要模块; 3)第三阶段:两段式“端到端”阶段,整体结构与上一阶段比较类似,包括感知和决策 控制两个模块,但是网络结构和训练方案整体差异存在差异,采用统一的全局最优目标进行训练,模块间采用隐式表达式特征信息传递,替代人为接口定义;4)第四阶段:一 段式“端到端”(One Model),不再有感知、决策规划等功能的明确划分。从原始信号 输入到最终规划轨迹的输出直接采用同一个深度学习模型。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 特斯拉公司研究报告:AI赋能的产业颠覆者(智联汽车系列深度之47).pdf
- 中国汽车:海外新能源车机遇和可能带来的风险(摘要).pdf
- 艺恩报告:智驾未来:AI重塑汽车消费新纪元.pdf
- 中汽协:2026年2月汽车工业产销报告.pdf
- (懂车帝)汽车以旧换新消费洞察白皮书.pdf
- 汽车零部件&机器人行业主线周报:智元“牵手”敏实,宇树发布新款四足机器狗.pdf
- 汽车与汽车零部件行业重卡新视界系列之燃气发电机组:北美缺电持续演绎,燃气机组迎“主电”新机遇.pdf
- 汽车和汽车零部件行业周报:人形机器人春晚破圈,国产链+T链齐飞.pdf
- 汽车零部件&机器人行业主线周报:敏实“牵手”绿的谐波,极智嘉发布仓储机器人Gino 1.pdf
- 汽车和汽车零部件行业周报:地补出台+需求见底,建议关注汽车板块.pdf
- 2026知识产权行业发展趋势报告:AI重构知识产权价值坐标,要么主动进化,要么被动出清.pdf
- AIGC报告5.0生成式人工智能行业深度研究报告(2026年版).pdf
- 大中华区半导体行业:中国AIGPU——缩小与美国的差距.pdf
- 电子行业深度:AI引爆供需缺口,光芯片迎黄金机遇.pdf
- 固收深度报告:债券“科技板”他山之石,海外科技巨头债券融资路径演变对我国非国有科技企业有何启示?(AI、半导体、新能源).pdf
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 汽车行业自动驾驶深度研究报告(105页ppt).pdf
- 2 新能源汽车零部件行业深度报告.pdf
- 3 新能源汽车产业深度研究报告:从2.0迈入3.0时代(113页).pdf
- 4 汽车电子行业深度研究报告:汽车电子,下一个苹果产业链.pdf
- 5 AQG324电动汽车试验标准.pdf
- 6 麦肯锡中国汽车行业CEO季刊 :制胜汽车行业下半场(210页).pdf
- 7 中国主要汽车集团低碳化转型表现.pdf
- 8 新能源汽车行业研究及2020年策略报告:拐点之年.pdf
- 9 中国商用汽车产业发展报告(2021).pdf
- 10 新能源汽车行业特斯拉专题研究:从拆解Model3看智能电动汽车发展趋势.pdf
- 1 镁行业分析(Ⅱ):供需或进入持续性紧平衡状态,多领域共振推动镁需求增长.pdf
- 2 人形机器人行业专题报告:汽车与机器人,两个产业的再次碰撞.pdf
- 3 智能底盘专题报告:汽车高阶智能化的最后一块拼图.pdf
- 4 中国汽车零部件行业市场研究.pdf
- 5 汽车行业报告:2025上海车展总结.pdf
- 6 小米集团研究报告:生态优势稳,汽车绘蓝图.pdf
- 7 华为产业研究之智能汽车系列专题报告:全栈智能,大有可为.pdf
- 8 数据突围:AI时代汽车全域营销实战手册.pdf
- 9 【亿欧智库】2025智能座舱操作系统洞察报告.pdf
- 10 汽车行业专题报告:中美汽车&零部件敞口梳理,板块超跌迎分化,自主崛起正当时.pdf
- 1 智能汽车产业深度研究:L3车型产品准入,智能汽车发展加速.pdf
- 2 产业观察:【CES 2026】AI巨头、人形机器人、智能汽车展出最新变化.pdf
- 3 汽车行业深度报告:空天资源紧缺,商业航天业务有望爆发.pdf
- 4 汽车行业:看好镁合金2026年加速上车.pdf
- 5 2025汽车人工智能行业应用案例集.pdf
- 6 汽车行业周报:TPU有望成为人形机器人安全保护材料,蓝箭航天提交招股说明书.pdf
- 7 AI智能汽车行业1月投资策略:特斯拉无接管横穿美国,工信部首批L3准入,看好智能化.pdf
- 8 2026年汽车行业端侧AI投资展望:特斯拉引领物理AI产业变革,无人驾驶价值链及空间跃迁.pdf
- 9 汽车行业:反内卷及出海预期改善,自动驾驶及机器人催化连连.pdf
- 10 汽车行业专题研究:智能座舱深度,渗透率提升+AI升级,国产供应链再成长.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年特斯拉公司研究报告:AI赋能的产业颠覆者(智联汽车系列深度之47)
- 2 2026年汽车行业轮胎月度跟踪(3):26出海加速拐点年,短期重视产能进度、关注原材料等弱化扰动项——产能、订单、销量&库存、成本4项(更新至2603)
- 3 2026年卡倍亿公司研究报告:汽车线缆龙头乘势而上,多元布局打开长期成长空间
- 4 2026年汽车行业:比亚迪推出兆瓦闪充,静待终端需求回暖
- 5 2026年希迪智驾公司研究报告:技术领跑,无人矿卡迎东风(智联汽车系列深度之46)
- 6 2026年豪能股份深度报告:汽车&航空航天&机器人三维布局,驱动持续成长
- 7 2026年Robotaxi系列报告三:汽车行业专题报告,中美两强竞争,全球商业化共振
- 8 2026年智能汽车行业:2026年智驾平权之车企智驾方案梳理
- 9 2026年汽车行业无人配送专题报告:无人配送应用前景广阔,国内迎来加速期
- 10 2026年毓恬冠佳公司研究报告:本土汽车天窗领军企业,国产替代+品类扩张驱动成长
- 1 2026年特斯拉公司研究报告:AI赋能的产业颠覆者(智联汽车系列深度之47)
- 2 2026年汽车行业轮胎月度跟踪(3):26出海加速拐点年,短期重视产能进度、关注原材料等弱化扰动项——产能、订单、销量&库存、成本4项(更新至2603)
- 3 2026年卡倍亿公司研究报告:汽车线缆龙头乘势而上,多元布局打开长期成长空间
- 4 2026年汽车行业:比亚迪推出兆瓦闪充,静待终端需求回暖
- 5 2026年希迪智驾公司研究报告:技术领跑,无人矿卡迎东风(智联汽车系列深度之46)
- 6 2026年豪能股份深度报告:汽车&航空航天&机器人三维布局,驱动持续成长
- 7 2026年Robotaxi系列报告三:汽车行业专题报告,中美两强竞争,全球商业化共振
- 8 2026年智能汽车行业:2026年智驾平权之车企智驾方案梳理
- 9 2026年汽车行业无人配送专题报告:无人配送应用前景广阔,国内迎来加速期
- 10 2026年毓恬冠佳公司研究报告:本土汽车天窗领军企业,国产替代+品类扩张驱动成长
- 1 2026年特斯拉公司研究报告:AI赋能的产业颠覆者(智联汽车系列深度之47)
- 2 2026年汽车行业轮胎月度跟踪(3):26出海加速拐点年,短期重视产能进度、关注原材料等弱化扰动项——产能、订单、销量&库存、成本4项(更新至2603)
- 3 2026年卡倍亿公司研究报告:汽车线缆龙头乘势而上,多元布局打开长期成长空间
- 4 2026年汽车行业:比亚迪推出兆瓦闪充,静待终端需求回暖
- 5 2026年希迪智驾公司研究报告:技术领跑,无人矿卡迎东风(智联汽车系列深度之46)
- 6 2026年豪能股份深度报告:汽车&航空航天&机器人三维布局,驱动持续成长
- 7 2026年Robotaxi系列报告三:汽车行业专题报告,中美两强竞争,全球商业化共振
- 8 2026年智能汽车行业:2026年智驾平权之车企智驾方案梳理
- 9 2026年汽车行业无人配送专题报告:无人配送应用前景广阔,国内迎来加速期
- 10 2026年毓恬冠佳公司研究报告:本土汽车天窗领军企业,国产替代+品类扩张驱动成长
- 最新文档
- 最新精读
- 1 中汽协:2026年2月汽车工业产销报告.pdf
- 2 全球产业趋势跟踪周报(0202)OpenClaw震动开源生态,Kimi K2.5发布能力不俗.pdf
- 3 互联网传媒行业·AI周度跟踪:2月国产与进口游戏版号下发,OpenClaw等Agent推动token增长.pdf
- 4 金工专题报告:OpenClaw深度测评与应用指南.pdf
- 5 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 6 大模型赋能投研之十六:OpenClaw搭建个人投研助理(一).pdf
- 7 OpenClaw:AI从聊天到行动+-+下一代智能助手白皮书.pdf
- 8 AI投研应用系列(二):下一代投研基建,OpenClaw从部署到应用.pdf
- 9 计算机行业周报:openClaw推动AI产业进入Agent时代.pdf
- 10 OpenClaw发展研究报告1.0版.pdf
- 1 2026年历史6轮油价上行周期对当下交易的启示
- 2 2026年储能行业深度:驱动因素、发展前瞻、产业链及相关公司深度梳理
- 3 2026年央国企改革系列之五:央企创投基金运作与产融协同
- 4 2026年大类资产配置新框架(13):A股和港股五轮牛市复盘
- 5 2026年公用事业行业UCOSAF生物柴油:短期边际变化与长期成长逻辑再审视
- 6 2026年医药生物行业In vivo CAR疗法:并购与合作持续火热,多条在研管线陆续迎来概念验证数据读出
- 7 2026年人形机器人行业投资策略报告:聚焦量产新阶段,把握供应链机遇
- 8 2026年小核酸行业系列报告(一):小核酸成药之路——Listening to the Sound of Silence,The Road to RNA Therapeutics
- 9 2026年信用债ETF研究系列一:升贴水率篇,折价幅度越大的信用债ETF更具性价比吗?
- 10 2026年基金经理研究系列报告之九十二:南方基金林乐峰,宏观为锚,质量为核,始于客户需求,打造多元可复制的固收+产品线
