理想汽车AI转型进度及优势在哪?

理想汽车AI转型进度及优势在哪?

最佳答案 匿名用户编辑于2025/04/28 09:46

公司转型 AI 企业,目标成为全球领先的人工智能企业,目前智驾、智能助手、基座大模 型研发齐头并进,机器人方面也开始有了布局计划。

公司重视 AI 研发,一年 100 亿研发 投入中接近一半投在人工智能领域。目前,公司在 AI 领域已积累了端到端+VLM 双系统 架构智能驾驶、自研基座大模型 Mind GPT-3o 等成果,并正在积极推进多模态模型 VLA 的研发。公司在 AI 发展上的节奏规划: 1) 短期,2025-2026 年: 智能驾驶方面,持续迭代端到端+VLM 智驾系统能力,2025 年实现 L3 有条件的自动驾 驶,涵盖城市和高速全场景 NOA 的无缝衔接。2025 年、2026 年逐步将综合 MPI(城市 +高速综合接管里程)提升至 500 公里、1000 公里以上。 智能助手方面,将理想同学从车机拓展到更多终端设备,建立跨设备 AI 生态,并提升其 在语言智能和多模态交互方面的能力,其中理想同学手机版 APP 已在 2024 年 12 月上 线,服务现有 100 万家庭用户(300-500 万人)。 2) 中期,2027-2030 年: 智能驾驶方面,三年内推出“摘掉方向盘”的产品,实现 L4 级别的自动驾驶。到 2030 年, 有 50%概率会做一辆人工智能超级跑车。具身智能方面,公司计划在解决 L4 级别自动驾驶汽车,即最简单的人工智能机器人后, 研发制造人形机器人,以拓宽世界模型的应用边界。 到 2030 年,希望公司能成为全球领先的人工智能企业。 3) 长期,2030 年之后: 终极目标打造“硅基家人”,这一阶段 AI 具备自主决策能力,能成为家庭成员的组织者与 记忆延续载体。 此外,公司结合制造业和未来发展,进一步泛化了 AI 的布局,在上述空间智能(GPT 等)、 智能驾驶之外,部署了智能工业、智能商业。

当前进度一:智驾。公司拥有 AD Pro 和 AD Max 两套智驾系统。公司车型全系标配智驾,以芯片进而功能 为核心差异,分为高阶 AD Max 和低阶 AD Pro 两套系统。 1) AD Max 系统:由公司全栈自研,代表了公司智驾技术的最高水平。该系统目前以双 英伟达 Orin-X 芯片+激光雷达为核心硬件,实现了覆盖高速、城区、泊车全场景的 智能驾驶功能。2024 年 10 月公司 OTA 推送了端到端+VLM 架构,标志着 AD Max 城市 NOA 进入新阶段。持续 OTA 之外,2025 年 AD Max 搭载芯片也有望全面升级 至英伟达 Thor-U 芯片。 2) AD Pro 系统:由公司和轻舟智航联合开发。该系统目前以地平线 J5 芯片为核心硬 件(无激光雷达),其大量数据及代码继承自 AD Max,以纯视觉方案的低成本实现 了高速 NOA 和智能泊车等核心功能。2025 年 AD Pro 搭载芯片有望升级至地平线 J6M 芯片,同时将会增加激光雷达。

软件方面,公司通过 OTA 迭代,目前已完成车位到车位智驾的全量推送,以下为最近两 年以来最重要的四个更新节点: 1) 2023 年 12 月,全量推送城市 NOA:覆盖全国 100 座城市,此系统基于 NPN 先验 网络,依赖高精地图和先验信息,通过感知、定位、规划等模块化流程实现行驶轨 迹的输出。 2) 2024 年 7 月,全量推送无图 NOA:从 NPN 转向分段式端到端架构,将复杂的模块 化流程简化为感知和规划,摆脱高精地图依赖,实现有导航就能开,将可用范围扩 展至全国。 3) 2024 年 10 月,全量推送端到端+VLM 架构:通过 VLM 视觉语言模型增强逻辑思维 能力,提高对复杂环境的应对,增加了路边起步、U 形掉头、环岛通行等功能。 4) 2024 年 11 月,全量推送车位到车位智驾:场景覆盖升级,实现从车位自主驶出、通 过 ETC 收费站、城市环岛/掉头、狭窄小路通过、自动泊入车位的全程无断点的智驾 体验。

高阶智驾 AD Max 车型销量占比提升。目前,公司车型仅在 AD Max 高阶智驾系统上支 持城市 NOA 功能。随着公司智驾能力的提升、城市 NOA 功能的优化以及消费者认知的 改变,AD Max 车型在公司销量中占比显著提升。从 2024 年 2 月的 20%增长至 2024 年 下半年的 50%以上。其中,在公司 30 万元以上、40 万元以上价格带中,AD Max 占比高 达 70%+、80%+(2024 年 11 月)。

当前进度二:座舱。理想座舱交互是市场公认比较出色的几家之一。公司车型全系标配智能座舱,自 2021 年 起通过 OTA 实现功能进化。2022 年 ChatGPT 的推出革新了自然语言交互范式,其基于 Transformer 架构的大模型技术显著提升了模型的语义理解、逻辑推理和多轮对话能力, 在此之后国内车企随之加速大模型在智能座舱上的应用,其中理想于 2023 年率先实现大 模型 Mind GPT 上车。截至当前,理想 Mind GPT 已实现三个版本的迭代: 1) 2023 年 12 月,Mind GPT 1.0:基于 TaskFormer 架构首次上车,语音助手"理想同学 "升级为"AI 理想同学",支持百科全书问答、行程规划、写作辅助、绘画大师等功能, 首次实现座舱交互从指令执行到意图理解的能力跨越。 2) 2024 年 8 月,Mind GPT 2.0:升级为 MoE(混合专家模型)+Transformer 架构,模 型规模翻倍但推理成本基本不变,2.0 重点优化长上下文理解能力和逻辑推理能力。 3) 2024 年 12 月,Mind GPT-3o:架构升级为多模态端到端大模型,能够实现从感知到 认知再到表达的完整能力。基于 Mind GPT-3o 打造的理想同学其语音识别准确率提 升 20%、绘画准确性提升 30%。

数据、算法和算力是 AI 能力竞争的三个核心要素。数据是通过采集并标注形成的多模 态信息集合,涵盖文本、图像、语音、传感器信号等,数据是模型训练的基础,例如特斯 拉标注数亿帧图像训练占用网络模型,解决识别问题。算法是解决问题的数学框架与 逻辑流程,决定数据的使用效率,如智驾端到端架构通过算法革新将传统的感知、决策 与执行模块整合为单一模型,提高了系统能力上限。算力是硬件提供的计算能力,云端 算力依托数据中心的高性能计算集群,完成千亿参数模型的并行训练,提供模型训练、 仿真测试与数据处理的支撑;端侧算力通过专用芯片实时处理数据,并做出低延时推理。 但是跳出 AI 能力本身之外,也需要看到团队、机制对 AI 业务发展的重要影响。对车企 而言,如果未来要深度参与 AI 行业,还需要和科技互联网公司竞争。那么是否有更适宜 于 AI 业务发展的团队、机制,也是车企作为制造行业进行转型调整的重要议题。 接下来我们在 AI 三要素和团队层面对理想的情况进行梳理。简言之,在车企行列中,理 想由于更早意识到 AI 世界模型的价值并行动,且得益于优秀的销量,优秀的管理,目前 已身处车企 AI 竞争的第一梯队。后续面对科技公司的竞争,理想依然有我们前文所述智 驾端侧的极大优势。

数据上:理想行业领先的销量将助力其积累更大规模的 AI 数据,形成正反馈。公司月销 位居在新势力品牌前列,2024 年起月销达到 5 万辆级。高销量帮助积累用户基数,庞大 的用户基础提供真实数据,数据驱动算法迭代提升 AI 能力,最终形成"销量增长-数据积 累-技术升级-销量增长"的正循环。截至 2024 年,公司累计销量超 100 万辆,其中除 19/20 款理想 ONE 均标配“理想同学”智能语音助手,智驾累计用户数达 110.9 万人,智驾累计 里程 29.3 亿公里。与竞对相比,理想销量和行驶里程高于鸿蒙智行、小鹏和小米,低于 特斯拉,考虑到特斯拉 2025 年 2 月才在中国开放城市 NOA 功能,理想在中国智驾上的 数据积累具备领先优势。

算力上:布局云端算力,支撑模型快速迭代。公司与火山引擎合作布局云端算力,截至 2024 年 12 月,算力达 8.1 EFLOPS,该算力对应年投入达 20 亿元水平。公司长期目标, 布局 100 EFLOPS 量级的算力以实现 L4 级别自动驾驶,彼时每年投入超 10 亿美金。充 足算力支撑模型快速迭代,2024 年实现 30 天迭代 12 版模型,平均 2-3 天迭代一个模型。 与竞对相比,理想略低于华为、与小米持平,高于小鹏,处于第一梯队。尽管算力部署上与特斯拉有量级差距,但在中国的算力部署上,理想仍具备一定优势。

算法上,理想是率先在智驾上使用端到端+VLM 架构的车企。2023 年特斯拉提出利用端 到端技术实现智能驾驶,随后国内企业在端到端智驾上快速切换。公司模拟人类的思考 逻辑,创新性搭建了端到端+VLM(视觉语言模型)的双系统架构。其中: 1) 端到端模型:负责处理常规的驾驶行为,类似人类的下意识反应。其通过全卷积神 经网络实时解析传感器输入的数据,并直接输出控制信号。该模型基于百万量级人 类驾驶数据训练,擅长模仿老司机的车道保持、跟车距离控制等基础能力,实现 95% 场景下的流畅通行。 2) VLM 模型:专攻高难度未知场景,类似人类的深思熟虑。其通过 22 亿参数的多模 态大模型,融合视觉特征与自然语言理解能力,可解析交通标识语义、推导施工绕 行逻辑、预判异形障碍物运动轨迹。例如在夜间无车道线路口,VLM 会生成链式推 理:“识别对向车灯→判断会车风险→生成减速让行指令”,再交由端到端模型执行 具体轨迹。

端到端+VLM 为中期 VLA 进而 L4 自动驾驶实现前置技术验证。引入 VLM 弥补了端到 端模型在语义理解与逻辑推理上的短板,形成“空间感知+语义推理”的双系统协同。这种 架构既保留了端到端的高效响应能力,又通过 VLM 实现了对复杂规则和长尾场景的覆 盖,是智能驾驶从“规则驱动”迈向“认知智能”的关键跃迁。同时,端到端+VLM 作为 VLA 基座大模型的前置技术验证,已初步打通感知-行动以及感知-语义推理链路,为后续引入 融合为共同基座模型 VLA 实现闭环决策奠定基础。如前文所述,目前端到端+VLM 仅能 实现 L2、L3 级别自动驾驶,实现 L4 需要通过 VLA 来实现。公司已在全力攻坚 VLA 智 能驾驶大模型,并计划于 2025 年 7 月同 i8 上市一同发布 VLA 智驾模型。 理想是率先提出 VLA 长期路线,并最早推出端到端+VLM 架构的车企。当前,行业内 主流智驾路线已切换至端到端架构,但各家技术路线上仍存在一定差异。比如理想、特 斯拉和小米使用一段式端到端架构,由传感器输入直接输出控制指令,而小鹏和华为使 用两段式端到端,传感器输入后,通过感知层提取特征,再由规划控制层输出指令。架 构上,理想和小米使用端到端+VLM 架构,而小鹏虽未融合 VLM 架构,但通过 XBrain 语言模型辅助智能驾驶场景理解。

2025 年 3 月,理想汽车发布下一代自动驾驶架构 MindVLA。VLA 是机器人大模型的新 范式,其将赋予自动驾驶强大的 3D 空间理解能力、逻辑推理能力和行为生成能力,让自 动驾驶能够感知、思考和适应环境。基于端到端+VLM 双系统架构的实践,理想自研 VLA 模型——MindVLA。MindVLA 不是简单地将端到端模型和 VLM 模型结合在一起,而是 所有模块都全新设计。具体到智驾体验上,MindVLA 赋能的汽车能成为听得懂、看得见、 找得到的专职司机,带来全新的体验。

听得懂:能通过语音指令改变车辆的路线和行为,如在陌生园区对车辆说:“带我去找 超市”,车辆将在没有导航信息的情况下,自主漫游找到目的地。

看得见:具备强大的通识能力,能够认识商店招牌,在陌生拍一张附近环境的照片发送 给车辆,车辆能够搜寻照片中的位置,并自动找到用户。

找得到:车辆可以自主漫游,在商场地库跟车辆说:“去找个车位停好”,车辆就会利用 空间推理能力自主寻找车位,整个过程不依赖地图信息。

此外,公司是率先推出基座大模型的车企。基座大模型是 AI 时代的“基础设施”,类似操 作系统,支撑上层应用(如智驾、座舱)。2023 年 12 月,公司首次发布基座大模型 Mind GPT 1.0,并搭载于 OTA 5.0 车机系统。 该模型使用自研 TaskFormer 架构(Transformer 改进版),支持文本、语音、图形等多模 态数据融合与任务导向型学习。通过 3 万亿 Token 高质量数据预训练构建通用能力后, 结合汽车场景数据微调(覆盖 111 个领域、超 1000 种专属能力),并依托百万量产车实 时回传数据,实现 OTA 高频迭代。后持续升级为基于 MoE+Transformer 架构的 Mind GPT 2.0 和基于多模态端到端架构的 Mind GPT 3.0。

与竞对相比,理想率先将大语言模型概念升级为基座大模型概念。Mind GPT 作为基座大 模型,不仅应用于智能座舱“理想同学”语音助手上,还延伸应用到智驾领域,辅助场景理 解与规划决策。相比之下,小鹏的大语言模型 XGPT 和小米的 MiLM 在车端主要应用于 智能座舱语音助手,华为的盘古大模型主要应用于智能座舱,同时能帮助生成训练数据 以辅助智能驾驶模型训练。特斯拉在 2025 年推出基座大模型 Grok3,具备强大的多模态 交互能力和推理能力,预计在车端也将同时应用于智能驾驶与智能座舱。

远期规划,基座模型将从 VLM 向 VLA 迈进。作为公司 AI 战略的初级阶段,MindGPT/ 基座模型已构建 VL(Visual-Language)融合能力,而远期规划的 VLA 基座大模型将进 一步整合行为智能,如与端到端智驾融合,解决复杂场景的“感知-思考-执行”闭环。届时, 基座模型将对理想生态中的各端侧赋能,智驾端生成拟人化驾驶策略、座舱端实现全场 景语音交互,并可以延伸到手机端、家居生态端、人形机器人等多个端侧。 团队和机制层面,分两块来看,一是公司整体组织架构的弹性、效率,二是公司在 AI 人 才团队方面的搭建。

创始人:李想曾成功创业两次,具备互联网+造车基因,以及极强的商业理解能力。李想 的三段创业历程大致为: 1) 泡泡网,2000 年上线:是为数码及消费电子爱好者提供专业的资讯、互动、购买等 服务的互联网平台,2005 年成为国内第三大中文 IT 网站。 2) 汽车之家,2005 年上线:是为汽车消费者提供选车、买车、用车、换车等所有环节 一站式服务的互联网平台,2006 年成为汽车垂直网站的第一。 3) 2015 年,创办车和家(理想汽车)。 创始人的能力往往是初创公司发展的关键,复盘泡泡网/汽车之家的创业与理想汽车的创 业具有相似点,李想都体现出了极强的行业理解力和战略眼光。

组织管理体系:公司学习华为升级矩阵型组织,提升管理效率。随着公司从 0-1 阶段向 1-n 阶段的转变,效率的关键从速度变成质量。同时,随着公司规模的日益壮大,经验丰 富的创始人对公司管理能力的权重相对下降,组织体系自身的合理性、成熟性权重上升。 公司全面学习华为的经验,迭代升级组织管理体系:

1) 2021-2022 年:尝试 IPD 流程。IPD(集成产品开发)是一种先进的产品研发流程,包括概念、计划、开发、验证、发布、 生命周期管理六个阶段,核心是由市场、研发、制造等跨部门团队共同管理项目整个生 命周期,打通车型从定义、设计、制造、营销、销售的全流程。从结果看,两年的 IPD 实 践为带来的价值显著:①需求端,爆款能力复制,理想 ONE 成功经验复制到 L9/L8/L7 车 型上,销量表现优秀;②供给端,产能爬坡的速度提升,L9、L8 均做到交付第 2 月交付 量破万;③利润端,全流程控制成本,获得健康的毛利率表现。

2) 2023-2025 年:全面升级矩阵组织。在 IPD 流程推进顺利的基础上,2022/12 公司全面启动矩阵组织升级,并计划在 2025 年 全面落地。同时,为支撑全面矩阵型组织升级和流程运营,公司在战略部和产品部的基 础上新增五个横向实体部门:商业部、供应部、流程部、组织部、财经部。矩阵组织的优 势在于:①能够更加聚焦于核心业务,从而提高工作效率;②构建高效的成长体系,促 进员工的快速成长;③通过互锁制度,实现团队之间的协同合作。公司进一步升级组织 架构,有望持续改善组织运行效率。 2024 年公司开启矩阵组织 2.0 升级,着重解决价值传递链条过长的问题,将各团队的工作更加聚焦于用户价值和经营效率的提升。此次组织升级中,CEO 办公室更名为“产品与 战略群组”,更加聚焦产品与战略,弱化供应链、商业销售职能,此外设立 GTM(Go to Market)团队,负责协同新产品上市操盘计划的落地,为市场结果负责。

AI 团队:以核心领军人才为驱动。AI 作为高科技行业,核心人物至关重要。 公司 CTO 为谢炎,曾在阿里巴巴和华为负责移动操作系统的开发,2022 年加入理想,负 责底层智能化技术(自研操作系统、算力平台等)的研发。 智能座舱领域,2021 年引进 AI 首席科学家陈伟,引领空间 AI 团队实现核心算法全自研, 推动理想同学成为车载语音交互标杆,并主导了 Mind GPT 大模型的开发。 智能驾驶领域,由副总裁郎咸鹏主导,其领导的智能驾驶团队在技术研发和产品落地方 面取得了显著的进展,如实现了全国唯一的端到端+VLM 智驾系统。 AI 团队方面,公司目前拥有智能驾驶、智能空间(座舱)、智能工业和智能商业四个团 队,前两个方向直接面向用户体验,后两个方向实现组织能力和决策能力的升级。公司 重视 AI 持续投入,每年 100 亿投入约一半用于 AI,预计随着公司 AI 转型战略的推进, AI 团队将进一步扩大。 为护航 AI 战略有效落地,公司在 2025 年进一步调整了组织架构,创始人李想将更多精 力投入到 AI 领域。2025 年,公司进行组织架构调整,总裁马东辉上任智能汽车战略负 责人,并担任产供销联席会主任,而原产供销联席会主任公司创始人兼 CEO 李想则将更 多精力投入到 AI 领域。此外,为支持公司 AI 新阶段的发展,公司成立基座模型部门, 并由原空间 AI 部负责人陈伟调任领航,原语言职能部负责人江会星接替成为成为空间 AI 部负责人。

参考报告

理想汽车研究报告:从造车到AI,争夺车企升维之战制高点.pdf

理想汽车研究报告:从造车到AI,争夺车企升维之战制高点。AI推动汽车商业模式与估值重塑,车企迎来升维之战。AI发展有望推动汽车商业模式从1.0传统硬件销售,走向2.0“硬件+软件”模式,最后升级至3.0“硬件+软件+服务”综合模式。中期视角下,商业模式变化带来市场空间扩张,预计2.0模式下国内市场空间有望从2025年的0.9万亿增至2030年的4.3万亿,CAGR36%。长期视角下,车企AI体系搭建完善后有望将商业版图拓展到更多领域,完成从高端制造企业向AI科技企业的转型。无论是未来市场扩张带来的终局量价提升,还是对标美股科技/港股互联网,新能源...

查看详情
相关报告
我来回答