市场规模快速增长,应用场景不断拓展。
一、市场规模:具身智能市场规模快速增长,未来前景广阔
具身智能市场规模快速扩容,未来前景广阔,预计 2026 年 将超万亿。2025 年以来具身智能市 场规模快速扩容,宇树科技创始人王兴兴在 2025 世界人工智能大会上表示“今年上半年全国智能 机器人行业平均增速可达 50%到 100%”。据 36 氪研究所预计,2025 年我国具身智能行业市场规 模预计可达 9731 亿元,其中机器人市场规模预计可达 5229 亿元,同比+8.9%,自动驾驶市场规模 预计可达 4502 亿元,同比+17.5%,到 2026 年我国具身智能行业市场规模预计将超万亿元。
人形机器人 有望率先 在工业 领域实现应 用,随后 逐步扩 展至商业服 务领域与 家庭生 活领域。工 业场景具有工作步骤标准化程度高、重复度高、场景相对封闭的特征,有助于人形机器人产品在早 期落地应用,据亿欧智库预测,2025-2030 年人形机器人有望率先应用于工业领域,2030 年后人形 机器人将逐步应用于商业服务领域,2035 年后人形机器人将逐步应用于家庭生活领域,到 2040 年 人形机器人市场规模有望达到近 3 万亿元水平。
二、应用场景:具身智能应用场景丰富,各领域应用不断深化
1.工业:人形机器人率先落地实践,头部企业产品进驻多家汽车工厂
人形机器人 在工业场 景的应 用前景广泛 。工业对自动化和智能化需求高,生产流程复杂,对效 率、精度和柔性有加较高要求,并且存在许多危险场景,能够通过人形机器人的应用实现效率的提 升和安全事故的降低,因而对人形机器人有较高的需求。人形机器人能够应用于汽车、电子电气、 化工、机械制造、纺织、食品饮料等多个行业的多个生产环节,具备广泛的应用前景。
多家头部企 业产品进 驻汽车 工厂,人形 机器人应 用场景 实践加速。目前已有多家企业将人形机 器人产品部署在以汽车工厂为代表的工业场景中,推动人形机器人在工业场景应用实践的加速,如 特斯拉 Optimus 进入自身工厂开始进行电池单元分装工作;Figure 02 在宝马生产线实践一段时间 后将速度提升 400%,成功率提升七倍;优必选与东风柳汽、吉利汽车、一汽-大众青岛分公司、奥 迪一汽、比亚迪、北汽新能源、富士康、顺丰等知名企业合作,推动旗下工业版人形机器人 Walker S 系列进入工厂“实训”,并在极氪汽车 5G 智慧工厂内部署数十台 Walker S1,尝试在同一统一 “大脑”指挥下承担协同工作,如分拣、搬运、装配等。
2. 特种行业:替代恶劣、危险 场景下的人类工作,当前应用 以机器狗为主,人形 机器人有 望适 配更多场景应用
特种行业作 业环境恶 劣、危 险度高,机 器人能有 效替代 人类工作。机器人能够解决人类在恶劣 环境下进行特种工作所面临的危险性难题,更好保障生命安全,提高救援效率,因而具备广泛的应 用场景,如能源勘探、化学品处理、灾害救援、水下/太空工作等。
机器狗率先 尝试在特 种环境 下工作,人 形机器人 能够适 配更复杂环 境,应用 前景更 为广泛。由 于特种环境各细分场景环境特征差异大,高质量训练数据较少、人形机器人当前运动控制有限等原 因,当前人形机器人在特种环境的应用较少,机器狗是目前率先在特种场景尝试应用的机器人主要 品类,如七腾机器人有限公司研发的防爆四足机器人-X3 stable 能负载 200 千克重物,可持续工作 5 小时,爬沟过坎能力强,能携带或挂载云台、机械臂等多种设备,搭载 500 多种 AI 智能算法,善 于完成多样化巡检、物资运输、抢险救援以及操作运维等任务。相比于机械狗,人形机器人的体征 与人类更为相近,在危害品处理、维修作业、救援等场景下更为适配,应用前景更为广泛,如德国 航空航天中心 (DLR) 研制的 Rollin’Justin 在设计之初计划用于太空作业 。
3.服务行业:应用场景多元化,头部企业积极探索商业化落地
商业服务具 有多元化 服务场 景,头部企 业积极探 索产品 在商业服务 场景下的 商业化 落地。商业 化场景多元化属性十足,机器人具备广泛的应用场景,智元机器人在首届合作伙伴大会宣布聚焦讲 解接待、文娱商演、工业智造、物流分拣、安防巡检、商用清洁、数采训练、科研教育八大场景, 推出定制化解决方案并实现多行业规模化应用。头部企业积极在多个场景探索产品的商业化落地, 如银河通用 Galbot 在 2025WAIC 期间,在商品货架前不间断长时间稳定工作,为李强总理、外方 嘉宾、国际组织代表等领导精准取送商品;傅利叶与建设银行上海浦东分行共同成立智能人形机器 人银行大堂经理场景训练基地,傅利叶 GR-1 负责协助工作人员完成银行大堂业务咨询、业务分流、 智慧柜员机个性化操作指南、金融业务讲解等服务;傅利叶 GR-1 入驻永达智己北外滩店,通过为 顾客提供丰富有趣的线下体验,为门店吸引大量客流。
家庭服务场 景能够提 供家务 服务与情感 陪伴,成 为有爱 的家庭助手。在家庭服务场景下,机器 人不仅能够提供清洁、整理等家务服务,还能够通过人机交互提供情感陪伴,如傅利叶发布的全尺 寸人形 Care-bot GR-3 搭载自研的全感交互系统,集成听觉、视觉、触觉三大模块,通过协同反馈 实现更自然、拟人的情感互动,并且嵌入微表情反馈,新增的眼神交互与表情系统可以通过转动眼 球、眨眼以及定制化瞳眸特效,增强情绪传达与陪伴感;1X 发布的最新家庭机器人 NEO Gamma 能够通过专有语言模型进行自然对话和富有表现力的肢体语言。
4. 物流行业:无人物流车市场规模快速提升,机器人可解决配送“最后 10 米” 难题
物流运输劳 动力成本 逐年上 升,软硬分 离的无人 物流解 决方案可明 显降低成 本与前 期现金流压 力。据国家邮政局数据,2019-2024 年,我国社会物流量和快递业务量逐年提升,2025 年全国社会物流总额为 360.6 万亿元,较 2019 年增长 21.0%,全国快递业务量为 1745.0 亿件,较 2019 年增 长 174.7%,劳动力成本为 2.3 万元,较 2019 年增长 35.3%。对比传统运输和无人车运输来看,前 期由于无人物流多为软硬一体的整车交付方案,初始投资大,经济性不明显,市场接受度不高,随 着软硬分离的解决方案出现,整车硬件购置成本明显降低,全生命周期成本经济性明显提升,能够 有效降低成本和前期现金流压力,无人物流车开始进入需求爆发期。
得益于技术成熟与经济性优势,无人驾驶物流车市场规模快速提升,2024 年突 破 1.5 万辆大 关。伴随自动驾驶技术的成熟、无人驾驶物流车成本的下降以及经济性优势的展现,无人驾驶物流 车的市场需求迎来爆发,据前瞻产业研究院估算,2024 年中国无人驾驶物流车销量已突破 1.5 万辆 大关,其中新石器交付量创 2400 台新高。
人形机器人在物流配送中有望应用于末端配送场景,解决“最后 10 米”难题。无人运输物流 车能够完成商品从发配地运输向网点的任务,从网点到终端消费者的配送任务仍以配送员完成为主, 目前行业在积极探索运用人形机器人产品解决“最后 10 米”难题,如乐聚与华为、中国移动联合发 布的业界首款 5G-A 具身智能机器人“夸父”能够与无人机协同配合,接收无人机投递的物品后完 成地面转运,技术成熟后有望替代部分配送员的工作。
三、上下游协同发展,推动具身智能产业进步
(一)具身智能产业链概述
具身智能产 业链涵盖 多个环 节,上游包 括零部件 和基础 软件,中游 包括整机 系统研 发设计、本 体测试、生 产制造、 系统集 成,下游覆 盖科研教 育、商 业服务、工 业制造、 高危作 业、医疗康 养、 家庭服务等应用场景。其中上游零部件可以划分成感知器件(如视觉、力/力矩、触觉及其他传感器 等),运动器件(如电机/控制、减速器、丝杠等),控制交互(如芯片、动力系统等);基础软件 包括操作系统、控制算法、大模型和仿真软件等。中游具身智能机器人具有多样化的本体结构,包 括臂式/轮式/足式/履带/复合/人形/仿生及其他无人系统等,其中人形以其更高拟人性、更强交互性 和对环境的适配性,成为最具关注度的形态。

从技术与产 业热点上 看,人 形机器人应 用正处于 资本期 望膨胀期,而零部件 正待从 期望值低谷 回升。2025 是人形机器人量产元年,技术与产业发展需求、政策方向均支持应用场景落地,积累数 据反哺产品迭代。当前产业发展核心卡点在具身大模型,重点问题在数据瓶颈和模型架构探索,区 别于智能汽车、AGV/AMR、四足机器人等产品,人形机器人操作重要性大幅提升,多指灵巧手设计 (含触觉传感器研究)、灵巧操作数据集、操作大模型成为提升功能性的关键。本体出货量尚小限 制了当前各零部件生产的规模效应,研发投入多而现阶段创收少,对零部件企业资金实力提出要求, 同时参与者快速增加,带来行业竞争加剧。但随 着量产 临近,具备 优质大客 户资源 、量产能力 强的 零部件厂商,或制造能力突出、专业化全维度协助初创企业落地的代工企业有望脱颖而出。
(二)上游:软硬件供应是具身智能发展的基础
1.核心零部件概览
核心零部件 占具身智 能整机成本比例较 高,涉及 技术原 理、材料、 工艺等多 领域, 是机器人实 现感知、运 动、推理 决策的 硬件基础。主要包括运动系统(电机,减速器,丝杠等,其共同集成关 节模组)、感知系统(传感器等)、控制交互(芯片、电池、充电系统等)。从产业角度看,零部 件行业的发展需要关注规模量产后 BOM 价值占比、原有市场空间、行业竞争格局(关注技术难度、 工艺难度、扩产难度、海内外差距等)、机器人方案迭代趋势等。此外,目前本体厂商硬件方案中 的增量变化集中在灵巧手、触觉传感器、轻量化、散热系统、高功率/转矩密度电机等,伴随量产时 点靠近,相关行业有望获得增益。
2.关节执行器
人形机器人 关节设计 需综合 考虑动态运 动控制、 平衡性 、负载能力 、经济性等多重因素,高扭 矩关节(如腕部、肩部、腰部 、髋部关节)对旋转幅度要求 高,多使用旋转执行器。高负 载关节(如 上臂、下臂、大腿、小腿关节)需要有较优的承重和支撑能力,线性执行器成为重要选择之一。 旋转执行器驱动方案 主要有 刚性驱动、 弹性驱动 、准直 驱动三种。不同驱动方案影响减速器、 电机架构等零部件的种类型号。其中刚性驱动主要由高减速比减速器(如谐波减速器)、电机、编 码器、高刚性力矩传感器(可选)和控制板等组成,精度高,但实现的运动能力有限,能量效率和 安全性相对不足。弹性驱动非目前主流的人形机器人驱动方案。准直驱动主要由低减速比减速器(如行星减速器)、高扭矩密度电机、编码器和控制板等组成,能量效率高,但精度一般。目前特斯拉 旋转执行器全部都是谐波减速器+电机方案,但出于经济性考虑,行星减速器+电机方案亦被很多国 内本体企业选择用于一些大负载关节,如宇树科技、智元机器人等。
未来搭配线性关节的机器人 本体占比可能提升 。线性执行器相比旋转执行器优势体现在:1)空 间利用率高,可以纵向分布,从而配备更大的电机;2)满足柔性需求,有些狭窄地方旋转关节太大 机器人难以进入;3)螺杆传动机构通过合理设计可以具备自锁能力,低耗能。目前已采用线性执行 器本体:特斯拉,开普勒,小米,小鹏,智澄 AI 等。尝试采用线性执行器本体:众擎,优必选等。
3.电机
具身智能机器人对 关节电机 的要求可概括为满 足尺寸限 制、高转矩密度(有限空间提 高驱动力、 快速动态响 应)、低 转矩波 动(精密操 作)、高 过载能 力(高爆发 力、大转 矩输出 )、高结构 强度 (抗冲击)。目前已经用于机器人的电机包括无框力矩电机(用于 Optimus 旋转执行器)、空心杯 电机(用于灵巧手手指关节)、无刷有齿槽电机(可用于灵巧手大拇指及绳驱版手腕处)。 无框力矩电 机仅包括转子和定子,没有轴、轴承、外壳或端盖,可集成到机械结构中,具备转 矩密度高、响应速度快、稳定性强、控制精度和集成度较高的优势,在散热上以结构散热为主,还 需进一步优化。 空心杯电机无冲片齿槽结构和铁芯,减少了电机运行时磁阻力矩,降低输出转矩波动,同时消 除了铁芯涡流效应引起损耗,减少了电机运行时的能量损耗,适用于高速、小型、高精度场合,但 扭矩较小需搭配精密行星减速箱,结构紧凑散热较弱,高精度依赖严格工艺和设备要求,成本较高。 无刷有齿槽 电机转矩密度高于空心杯电机,适合更高负载、预留空间更大的场合。但存在齿槽 转矩影响精度,铁芯涡流效应引起能量损耗,噪声相对更大。基于其成本优势,且绳驱版灵巧手将 驱动电机集成到手腕手臂处空间更足,无刷有齿槽电机在机器人中应用范围可能扩大。
按关节拓扑 结构分, 常见的 机器人关节 电机拓扑 包括内 转子径向磁 通永磁电 机、外 转子径向磁 通永磁电机 和轴向磁 通永磁 电机。特斯拉等机器人本体用的无框力矩电机主要是内转子结构。而宇 树科技、本末科技、灵足时代的关节模组则采用外转子电机+行星减速器的准直驱模式,主要由于外 转子电机较内转子电机具备更大转矩,其构成的准直驱执行器反驱性好、机械阻抗低,使机器人抗 冲击性和动态响应性提升。基于对更高 转矩密度 的需求 ,轴向磁通 电机关注 度提升 ,其较之径 向磁 通电机轴向长度短,结构紧凑,转矩/功率密 度高,目前“青龙”机器人、广汽 GoMate 已尝试采 用。但当前轴向磁通电机高扭矩持续输出时存在较严重的发热严重,批量化生产工艺难度高、材料 利用率低,限制了其广泛应用。
4.减速器
减速器是连 接动力源 和执行 机构的中间 体,能够 匹配转 速和传递转 矩。按照控制精度可划分成 一般传动减速器和精密减速器。精密减速器主要 包括谐波 减速器、RV 减速器、行星 减 速器、摆线针 轮减速器等。 减速比(减速装置 的传动比)/扭矩、大小/重量、精度、价 格等是选择减速器 的主要参 考因素。 谐波减速器具备高精度特性,但受制于柔轮反复性变带来的寿命折损,目前主要用于机器人小臂、 腕部等轻负载关节,并不适用于高负载强冲击场景。行 星减速器结构简单,成本较低,但具备较大 传动间隙,适用于对精度要求不高的末端执行器。RV 减速 器常用于工业机器人重负载部位,以及汽 车、运输、港口码头等行业,但由于重量和体积偏大,并不适配对运动灵活性有一定要求的机器人 本体。随着材料和工艺不断进步,摆线 针轮减速 器凭借“精度高于行星、负载优于谐波、体积小于 RV”优势,逐渐成为人形机器人关节构成的重要考量。我 们认为,未来各 类减速器应 用 并非完全互 斥,而将根据不同应用场景要求进行灵活选择。
5.丝杠
丝杠是一种将旋转 运动转化 为直线运动的机械 传动装置,是工具机械和精密 机械上常 见的部件。 在人形机器人中使用的丝杠产品包括滚 珠丝杠和行星滚 柱丝杠,前 者可用于 构成灵 巧手,后者 主要 构成线性执行器。

滚珠丝杠下 游应用更 宽泛, 行星滚柱丝 杠工艺难 度更高 ,国产率更 低。滚珠丝杠下游是各类型 通用装备,如注塑机器、机床等,应用较宽泛。性能上,行星滚柱丝杠相比滚珠丝杠具备更强的承 载能力、刚度和抗冲击能力,以及更快的相对旋转速度和更长的寿命,更适合对“高效率、高精度、 高可靠”有要求的场合。但其对上游机器设备的要求及加工制造难度高于滚珠丝杠,国产化率更低。
丝杠较成熟的加工方 式可以 分为车削、 铣削、磨 削、轧 制。磨削产 品精度和 寿命高 ,但效率和 成本控制上不及车削。磨削精度可达 G1 级,表面粗糙度值较低,产品寿命长,但加工工序多、效率 较低、对磨床等设备要求高,整体制造成本偏高。车削精度可达 C3-C5,加工效率高,对加工设备 要求不高,切屑带走部分切削热从而降低螺纹表明烧伤或开裂风险,但刀片磨损较快。铣削加工精 度可达 G3~G5 级,采用干切削加工工序短,生产率高,且绿色环保,但前期设备投入较大,对刀具精度、耐磨性和寿命要求高。轧制自动化程度高,效率高,生产成本低,比较适合大批量生产,但 精度偏低,暂可达 G9 级,且齿形精度取决于轧辊精度及寿命,设备成本偏高。 内螺纹磨削 加工效率 在提升 ,“以车代 磨”得到 尝试。现阶段滚珠丝杠副中螺母主要研磨,丝 杠可冷轧/研磨,冷轧偏批量制造,精度更低,磨制偏精密制造。同时“以车/铣代磨”凭借更低成本 更高效率特征,运用也逐渐广泛。行星滚柱丝杠副螺距误差要求更严格,加工难度更大。当前人形 机器人对行星滚柱丝杠精度要求普遍为 C3-C5,随着产品量产临近和落地应用加速,对精度、效率、 一致性与成本控制综合要求提升。在核心步骤螺纹加工环节,研磨为主,伴随技术/工艺进步,基于 磨削工艺的内螺纹加工效率在提升,砂轮材质也逐步优化以减少砂轮磨损带来的中径锥度异常。同 时,亦有厂家尝试用高精度数控车床和高精度成型刀片通过车削完成螺纹加工。
6.灵巧手
当前机器人灵巧手 技术路径 尚未统一:手指 数量有 2/3/4/5 指,自由度 覆盖 6dof 至 20+dof, 驱动传动方式有全直驱、齿轮/蜗轮蜗杆传动、连 杆传动、腱绳传动等。灵巧手种类多元,按自由度 数量可以分为全驱动和欠驱动;按驱动方式可以分为液压驱动、电机驱动、气压驱动和形状记忆合 金驱动;按机械传动形式可以分为腱传动、连杆传动、齿轮/蜗轮蜗杆传动;按感知技术可以分为内 部感知和外部感知。目前电机驱动是灵巧手驱动主流方式,因为液压系统维护和制造成本较高,波 士顿动力液压版 Atlas 已于 2024 年被电驱动版取代。传动方式上,特斯拉 Optimus 三代灵巧手采 用“腱绳+精密行星减速器+微型丝杠”,节省空间实现减重,但具有刚度和位置精度有限的问题。除此之外,星动纪元初代手选择齿轮方案,因时机器人选择连杆传动,但二者具有柔性欠缺、对手 内空间配置要求较高的不足。
当前灵巧手领域的技术进步主要体现在:1)从单一款式扩 充至产品矩阵 :因时现有产品为 12dof, 计划后续推出高自由度版;灵心巧手 L30 推出直驱和绳驱两种版本;灵巧智能推出 3 指 8dof 性价 比版 DexHand21 S 和 5 指 22dof 高自由度版 DexHand21Pro;雷赛今年推出普及版 11dof DH116 和高自由度(20dof)DH2015。2)传 感反馈 更多 元:标配触觉比例提升(电容式或压阻式),视 触觉/电磁式指尖指腹可自主选配,手指近端/手掌/手背后续可能加电子皮肤,部分场景应用可能集 成温度传感器。3)集成度提 升:将驱动单元从手掌集成到手腕,强脑科技 Revo 2 内置集成三维触 觉传感器,因时推出驱控一体微型伺服电缸,灵心巧手“工业大师版”配备驱控一体电缸模块,兆 威机电采用高性能 MCU 单芯片整合多电机控制。
7.传感器
传感器是助 力机器人 从程序 控制逐步走 向感知型 和智能 型的重要组 成部分。目前人形机器人传 感器可分为内部传感器和外部传感器,前者测量自身状态的内部传感器,包括位置、速度、力传感 器等,后者测量与机器人作业有关的外部环境及状态,包括视觉、触觉等各种感官传感器。
(1)力传感器
力传感器能将力的 量值转化 成相关的电信号,检 测压力、张力、重量、扭矩、应变 和内 应力等, 是动力设备 、工程机 械及工 业自动化系 统等领域 的核心 部件之一。按照测量维度划分,力传感器可 以分成一维至六维等不同种类,如果力的方向和作用点都是固定的,那么只需选择一维力传感器。 如果力的方向随机变化,力的作用点保持不变,并与传感器的标定参考点重合或接近,那么可以选 择三维力传感器。如果力的方向和作用点都在三维空间中随机变化,那么应该选择六维力传感器进 行测量。
六维力传感 器按照测 量原理 可分为电阻应变式、 电容式 、光电式、压电式、 压阻式等。其中应 变式基于应变片的电阻-应变效应实现力/力矩信号的检测,具有精度高、测量范围广、技术成熟的优 点,是目前应用最广泛的类型,但其不足之处在于桥路受外界因素影响大,有蠕变和零漂,且布线 复杂,封装工艺要求高。电 容式通过设置一对电容,由电极片间的相对空隙变化来实现多维力的测 量,线性响应好,动态范围宽,易实现非接触测量,但抗干扰差,存在寄生电容的问题。光电 式通 过弹性体的变形调制光波,使接收器接收到的光强发生变化,具备高分辨率、与视觉技术相容性好、 抗电磁干扰强优点,但结构刚度低,对测量环境要求高,成本较高。压电式主要基于压电效应工作, 适合动态测量,但无法长时间作用静态力。压阻 式原理为两个相对(或相邻)电极之间敏感材料的 电阻随作用压力载荷的变化而变化,动态范围宽,负载能力强,但存在迟滞和非线性。
在人形机器人领域 ,六维力传 感器可用于力控反 馈,步态平 衡,重心和安全控 制,地面识 别等, 可配置在手腕、脚踝和灵巧手(在研,难度较 大)。特 斯拉 Optimus Gen2 将其 用于手 腕和脚踝。
(2)惯性传感器
惯性传感器(IMU)主要由 加速度计、陀螺仪和磁力 计 构成,是将物体加速度、位 置和姿势转 化成电信号的装置。在人形机器人领域,其通常可安装在胸腔、骨盆、灵巧手/脚等重要部位,发挥 导航、测量、稳控的作用。目前 IMU 方案已经被集运用在机器人产品中,如特斯拉 Optimus Gen2、 UCLA 的 ARTEMIS、波士顿动力 Atlas/小米 CyberOne。
(3)视觉传感器
机器视觉通 过光学装 置和传 感器等硬件 接收物体 图像, 叠加软件算 法处理图 像,以 获得所需信 息并控制机 器人运动 。其主要由光学元器件(工业相机与工业镜头、光源等)、传感器、图像采集 器、PC 平台、视觉处理软件、控制单元等组成。机器视觉最常见的用途是目视检查和缺陷检测、定 位和测量零件,以及对产品进行识别、分类和追踪,广泛用于 3C 电子(25%)、汽车(11%)、半 导体(10%)、医疗(8%)、教育、交通运输和安防等多个行业(2022 年数据)。不 同人形机器人 产品采用的视觉方 案不尽相 同。特斯拉 Optimus 和优必 选 Walker 采用了多目视觉,波士顿 Atlas 采用激光雷达加 ToF 深度相机,宇树科技 H1 选择深度 相机+激光雷达。
(4)触觉传感器
触觉传感器能够模拟 人类触 觉并感知物 体形态、 质地、 压力等信息 。根据工 作原理 不同,其可 以大致分为压阻式、 电容式 、压电式、光电式、 电磁式 、气压式、 摩擦发电 式等。压阻式触觉传感 器将外界机械刺激转化为材料或器件的电阻值变化。电容式触觉传感器借助外部载荷引起电介质形 变,改变电极之间的距离和正对面积,进而导致电容变化。压电式触觉传感器利用材料受到外力作 用时产生电荷的特性,将施加于压电材料的外部载荷转换为可检测的电势差。光电式触觉传感器通 过观察光信号来检测接触产生的形变。电磁式触觉传感器基于外力作用下磁性材料位移或形变,从 而使磁场发生改变的现象,通过霍尔传感器检测到的磁通量变化反映外力的大小与方向。
8.芯片和算力
机器人大小脑芯片 一般选用 大算力芯片,特斯拉采用 自 研 FSD 芯片,国内本体厂主 流选用英特 尔 x86 芯片和英伟达 Jetson,国产芯片亦被 尝试。特斯拉机器人 Optimus 主芯片采用 FSD HW4.0 (端侧)+Dojo D1(云端训练芯片)组合。宇树 G1 和机器狗 Go2 采用 8 核 CPU+高算力模组 Nvidia Jeston Orin(EDU 款配备),H1 和机器狗 B2 标配 Intel Core i5(平台功能)/Intel Core i7(用户 开发),选配 Intel Core i7 或 Nvidia Jetson Orin NX。智元灵犀 X2 基础算力采用瑞芯微 RK3588*2, Ultra 版搭配 Nvidia Orin NX(16GB 157TOPS)。优必选 Walker X 选用了 Intel i7-8665U(双路, 1.9GHz)+NVIDIA GT1030 显卡(384 核心)。众擎通用人形机器人 PM01 采用 8 核 CPU Intel N97 作基础算力,同时教育版搭配 Nvidia Jeston Orin。
英伟达 8 月 25 日发布了新 一 代机器人专用芯片 Jetson Thor,AI 计算能力是上一代的 7.5- 10 倍,能效是 上一代的 3.5 倍,I/O 吞 吐量提升 10 倍 ,内存容量也提升两 倍。这些能够帮助机器 人更好处理端侧多元传感器数据和进行视觉推理,提高性能并降低延迟。当前银河通用、智元、优 必选、众擎、联影医疗等均将搭载最新 Jetson Thor 芯片。期待 AI 芯片性能提升助力具身大模型 实现新突破。
9.电池&续航&散热
目前很多人形机器人还是采用圆柱形锂电池,但体积重量限制+工业场景连续少 间断 作业需求, 要求锂电池 能量密度 高和瞬 时放电。如:欣旺达高镍高硅化学体系加轻量化结构设计提高电池能量 密度;亿纬锂能采用掺硅负极高镍正极、超薄顶盖设计、全极耳设计提高能量密度和极速快充。新 电池方案则包括半固体/全固 态:广汽集团 GoMate 采用全固态电池方案,续航达 6h。 此外,提高续航 亦可通过结构 设计和算法优化 :1)结 构设 计:采用线性关节自锁设计,无需电 机运行保持站立;优必选将 1 个大电池包分成 2 个小电池包,支持热插拔自主快速换电;跨维智能 W1 等采用轮式底盘,可将更大电池包置于底部。2)算法 优化:通过控制算法让部分电机而非全部 电机工作。 散热处理上,主要有冷却降 温 、材料散热 、控制算 法优化 3 种方式。1)冷却降 温:主要包括风 冷(普通工况多用,可用于感知系统、控制系统、能源系统),液冷(动力系统,能源系统、计算 系统等),相变冷却等方式;2)材料散热:采用高导热复合材料,比如石墨烯涂层、铝合金基体、 碳纳米管增强材料,提高电机外壳的热传导性能,如把电机芯片贴上散热硅胶,然后贴在锯齿状铝 片上;3)控制算法:让不需要工作的电机低功率运行。单纯物理降温需要时间,在持续工作的情况 下降温效果不佳。控制算法降温效果可大幅提升,但难度较大。
10.数据、算法和大模型。
(1)数据
机器人技能 学习所依 赖的数 据源可以分 成两种, 一种是 机器人经验 数据,以 直接执 行策略或遥 操作为代表 ;第二类 是人类 数据,包括 人类动作 捕捉数 据和人类活 动视频数 据。机器人经验数据表 现出较小的形态差异,可以直接应用于策略学习,但通常较为稀缺。相反,人类数据更为丰富,但 由于人类与机器人在身体比例、关节配置和质心分布等上存在明显差异,此类数据的使用依赖有效 的重定位解决方案,且收集到的人类数据多数仅有本体感知,缺乏交互中的感官信息输入。另外, 通过算法、仿真或其他人工方法生成合成数据,并构建虚拟环境,让 AI 智能体在其中学习和训练, 可一定程度上降低真机数据不足的限制。 目前研究方法之一是多层次数据融合。比如 GR00T N1 底层采用 Web 图文数据用于 VLM 预 训练,人类第一视角视频用于 System 1 DiT 的预训练;中层采用合成数据,包括视频生成数据和 仿真环境中生成的数据;顶层采用 GR-1 人形机器人真机数据和 OpenX-Embodiment 机械臂数据。

(2)控制算法和 大模型
传统运动控制方案 主要采用 Model-Based 方法(基于模型的控制方案),从 LIMP+ZMP 演 变至 MPC+WBC 并进一步向 全身动量控制发展 。
MPC( 模型预测控 制)控制过程包括模型预测、优化求解和实时控制,通过测量机器人的状态 (如机身位置、速度和角速度),预测出一个时间序列内的机身状态。参考状态与实际测量值被输 入优化求解器,结合约束条件,求得未来 n 步的控制指令。选取第一个控制指令作为期望的末端接 触力与力矩,输入到内部多关节系统控制中。MPC 优势在 于:1)能够显式考虑复杂动力学;2)同 时平衡稳定性、能效、运动速度和平滑度等多个目标;3)直接考虑关节限位、摩擦锥约束、足端位 置限制等多种限制因素;4)具备一定的预测能力。但是,MPC 局限在于 :1)简化模型问题:通常 基于简化模型(如单刚体),无法直接考虑完整的机器人关节动力学;2)计算复杂度挑战:在全身动 力学水平上直接应用 MPC 会导致优化问题复杂,难以实时求的可行解;3)结果仍需处理:MPC 计 算出足端接触力,仍然需要使用雅可比矩阵转移为关节力矩命令;4)忽视短期控制:关注长期轨迹 优化可能忽略短期控制需求,降低对突发情况的即时响应能力。 WBC(全身运动控制)代表一组控制器,生成关节扭矩、速度、位置,侧重于协调机器人多自 由度的全身运动。WBC 核心原理是将控制的目标任务理解为分优先级的多任务控制。适用情形:1) 期望轨迹是基于降阶模型计算的,仅编码机器人全身运动的重要子集,不包含所有关节的信息;2) 轨迹是用全阶模型规划的,但计算量太大,无法实时应用(WBC 较 MPC 更新频率更快);3)环 境不确定性和规划不准确会导致干扰。 MPC+WBC:MPC 提供最优轨迹,关注长期预测,WBC 执行多任务协调,注重短期控制。
强化学习(RL)借助智能体 与环境的交互产生 的数据来 训练和优化策略 。其目标是得到一个最 佳策略(“状态-动作”映射),在每个状态下选择最优的动作,以最大化长期累积奖励。无模型 RL 无需显式得使用状态转换概率/函数,更为简单,且在多地形混杂的不规则场景、极限场景中表现更 优,泛化度高。但 RL 面临奖励设计依赖工程师经验、可解释性和行为预测性较差、无法在线调整 参数等限制。目前 RL 多在模拟环境中训练,主要是由于其依赖于大量观察与动作、丰富的奖励函 数、学习设计、大量试错,这在真实世界很难满足。此时 sim-to-real 差距是需要解决的核心问题。
机器人操作基础模型可以分成三类:传统方法、分层式、端到端。 分层式方法利用预训练的语言或视觉语言基础模型作为高级任务规划和推理引擎,以理解用户 指令、解析场景信息并将复杂任务分解为一系列子目标。这些高级输出(通常是可操作的知识或图 像语言标记)随后被传递给低级操作策略(通常是通过模仿学习或强化学习训练的专家策略),以 执行物理交互操作。Transformer 因其可扩展性而成为此类低级策略的常见选择。优 势:充分利用 了基础模型强大的语义和逻辑推理能力,同时结合了低层策略在具体动作执行中的效率,使机器人 在多任务处理和跨场景泛化方面表现出色。具备模块化和可解释。挑战:信息瓶颈以及高层与低层 之间语义鸿沟等。如,Figure AI Helix,NVIDIA GR00T N1 等。 端到端方法将机器人操作数据直接纳入基础模型的训练或微调过程,构建端到端 VLA 模型。这 些模型直接学习从多模态输入(如图像和语言指令)到机器人动作输出的映射。通过对大量机器人 交互数据进行预训练或微调,VLA 模型可以隐式学习任务规划、场景理解和动作生成,而无需显式 的层次结构。优势:允许模型针对下游部署任务进行整体优化,从而可能提升性能。挑战:通常需要大量机器人数据,并且模型的可解释性相对较弱。例如,谷歌 DeepMind 的 RT2。
VLA 难解数据问题之时 ,研 究者对世界模型的 关注提升,其是理解现实世界 动态 (包括其物理 和空间属性) 的生成式 AI 模型。使用文本、图像、视频和运动等输入数据来生成视频,通过学习 能够理解现实世界环境的物理特性,从而对运动、应力以及感官数据中的空间关系等动态进行表示 和预测(英伟达)。世界模 型让系统能 够超越直 接的感 官输入,进 行深层次 的推理 和决策,不只根 据相关性而真正能理解动作。但其与 VLA 一个重要不同在于,世界模型只能模拟到机器人采用不同 推理策略、执行不同动作后能得到的结果的视频效果,但是这些动作并非真实执行,模型不知道后 续执行是否有误。此外,世界模型目前尚难以在共享环境中模拟多个独立智能体之间的复杂交互。
当前,基于学习的 方法在运控 、导航、机器人操 作上重要性 提升。基于强化学习的方法在跑步、 跳跃和复杂地形适应上已表现较优,并在处理动态障碍物避让上提供了较强灵活性和适应性。步态 规划上,近期研究多将基于优化的精确轨迹与基于学习的控制策略相结合,以提升越野性能。操作 层面,随着大规模数据收集,基于学习的端到端方法日益重要,尤其是强化学习之于复杂多指灵巧 手双手操作。
(三)中游:产品制造是具身智能发展的关键
目前人形机器人厂商呈现百花齐放态势,我们将主要参与者大致归为五类: 1)初创公司:产品迭代速度快。该门类下可再细分, 第一种,机器人类企业,基于人形机器人与其他机器人类产品技术同源,在机械结构设计和运 控上具备优势。比如傅利叶智能、宇树科技。 第二种,创始人或重要高管具有互联网/智驾从业背景,其在模型算法使用上具备一定敏锐度, 如海外 Figure AI、1X Technologies,国内的智元机器人等。 第三种,其他创业公司,比如优必选,开普勒机器人、乐聚机器人等。 2)汽车厂商 :具有技术、场景和供应链优势。技术优势体现在算法和精密制造,场景优势体现 在 to B 工厂实训和数据收集,供应优势体现在人形机器人和电动车零部件存在一定重叠,车厂主动 选择熟悉的集成商和零部件供应商更加高效。比如特斯拉、小鹏、广汽集团、赛力斯。 3)消费电子类公 司:3C 供应链企业具备较强的大规模量产质量&成本管控能力,在组装和代 工上具备经验积累,比如蓝思科技、领益智造等。3C 品牌厂商则具备较优的 toC 产品推广能力,在 家庭服务场景更有优势,如小米、APPLE 等。 4)科研机构/创新中心:具有研发经验和资金支持。比如银河通用机器人、星动纪元等。 5)其他科技/互联 网大厂:目前人形机器人成为海内外科技/互联网大厂共识的方向之一,基于 较强的技术、资金、人才实力,腾讯早期曾试水推出类人形机器人“小五”,字节等在也在加快布局,是实力强劲的潜在竞争者。本体之外,科技/互联网大厂目前更多的是采取投资+自研大模型的 方式参与人形机器人产业,如阿里&蚂蚁投资宇树、星海图、逐迹动力等;腾讯投资宇树和智元;美 团投资宇树、银河通用、星海图等,布局医疗配送、无人零售、低空等领域;京东投资千寻智能、 众擎机器人、逐迹动力等,配合自身 JoyAI 大模型和 JoyScale AI 算力平台,服务公司物流、仓储 等供应链场景。 我们认为,未来人形机 器人赛 道中有望能够脱颖 而出的本 体厂商,要拥有多领域 跨学科 人才(如 具备前瞻性的领导者,AI 及 其他算法、硬件、生 产制造、供应链等领域人才 ),可构建 长期技术壁 垒(如模型 架构、数 据来源 和策略), 能够解决 真实问 题并给客户 明确投资 回报。 机器人赛道 上的 角逐,将是人才吸引能力+技 术实力+产品思维+融资能力 的综合体现。 随着量产加 速,我们 同时建 议关注制造 能力突出 、专业 化全维度协 助头部本 体企业 落地的代工 企业。当前众多具身智能机器人企业是初创公司,对资源利用效率要求更高,缺乏大规模制造经验, 外部代工-内部组装可能是走向规模量产的重要一环。对于代工企业而言,可以扩大规模,摊薄成本, 深度参与产业技术与产品迭代。当前丰立智能-星动纪元,蓝思科技/均普智能/领益智造/宁波华翔/ 博众精工-智元机器人,蓝黛科技-乐聚机器人已达成代工合作,禾川科技和雷赛智能等也属意开展 代工业务,我们看好制造能力已被验证、具备优质本体客户资源的代工厂商。
(四)下游:应用场景是具身智能发展的动力
根据 2025WRC 发布的《人形机器人十大潜力应用场景》,结合 2025WAIC 和 WRC 现场展示 情况,应用场景相似特点是,劳动密集、重复性强,风险 高 、结构化/简单半结构 化。通过初期投入、 后续运营成本、政府政策支持等维度对机器人落地投资回报情况进行衡量,我们归纳了两个筛选易 于落地应用场景的角度,第 一 是技术可实现性 ,即在容错 率 高,执行速度/同步性要求 不 高,可重复 纠错,易于 收集数据 的场景 具备率先落 地优势; 第二是 成本效益, 即在区别 于自动 化、能体现 物体 /任 务/环境 泛化 性, 能真 正提 高效率 或降 低死 伤率 的场 景 具备率 先落 地优 势。我们看好中短期具身 智能机器人在工业物流、toB 机构养老、特种环境(转炉炼钢,石油化工,电力巡检),以及 toC 陪 伴&玩具机器人场景中的应用,长期走进家庭。