近年来,具身智能领域发展迅猛,强调机器人在真实世界中与人类、环境及其他机器人之间的有效交互。
一、具身智能灵巧操作大模型
近年来,人工智能和机器学习的迅速发展推动了具身智能技术的突破,特别是在大模型驱动的机器人控制、操作和决策领域,展 现出极大的技术潜力和市场前景。具身大模型通过统一的多模态架构,整合视觉、语音、触觉等信息,显著提升了机器人灵巧操 作能力,推动机器人技术在多个行业中的广泛应用。 2024年3月,UC伯克利机器人领域的领军专家Sergey Levine创立了公司Pi(Physical Intelligence),核心团队汇集了硅谷机器 人和人工智能领域的顶尖专家。Pi的目标是通过一个通用模型将AI带入物理世界,为各类机器人和物理设备提供动力,适用于广泛 的应用场景。公司专注于开发纯软件的机器人基础模型,以VLA端到端具身操作大模型范式为基础,为多种硬件形态的机器人赋 能。同年7月,Skild AI宣布完成3亿美元A轮融资,投资者包括杰夫·贝佐斯、日本软银集团、红杉资本和卡内基梅隆大学等,将公司 估值推至15亿美元。Skild AI由卡内基梅隆大学教授Deepak Pathak和Abhinav Gupta于2023年创立,专注于开发基于物理世界的 智能系统,致力于构建类似“机器人大脑”的机器人基础模型。其技术旨在赋能各类机器人应用,挑战“AGI只能来源于数字世界”的 传统观念,展现了极大的行业潜力。
具身智能灵巧操作大模型在工业、医疗和家庭服务等领域落地应用,并取得显著成果:1)制造业:灵巧机器人承担精细装配、质 量检测和智能决策任务,大幅提高生产效率和自动化水平;2)医疗领域:在手术辅助和康复训练中的应用提升了手术精确性和 康复效果;3)家庭服务:灵巧机器人未来将成为家庭中的“伙伴”,提供更智能化和个性化的服务体验。 全球范围内,各类机构与企业积极布局具身智能灵巧操作大模型。清华大学TSAIL团队的RDT模型、Google DeepMind的RT系列等,不 仅在任务执行的精确度和多样性上取得重大突破,还通过跨领域合作与开放共享,推动了机器人智能化的发展。这些技术创新为 具身智能研究提供了新的方向,并缩小了机器人操作与人类操控之间的差距。
根据市场分析,具身智能领域已成为全球资本追逐的热点。2024年,中国具身智能领域记录了38起投融资事件,总金额达到51.1 亿元人民币。随着技术进步和市场需求增长,具身大模型机器人市场预计将实现爆发式增长。例如,在智能生产线中,具身通用 多模态大模型通过实时感知和智能操作,提升了自动化水平;在医疗与康复辅助领域,这些技术优化了个性化服务并提升了医疗 质量。 展望未来,具身智能灵巧操作大模型不仅是人工智能和机器人领域技术进步的重要支柱,也是产业转型升级的核心动力。随着跨 领域技术(如物联网、5G通信)的深度融合,智能灵巧操作具身系统将为社会提供更高效、更智能的生产和生活解决方案,推动 社会全面向智能化方向发展。
二、空间智能
在视觉大模型(VLM)和具身智能的领域,感知性能对整体性能的提升起到了至关重要的作用。然而,目前主流的VLM模型在空 间智能方面表现仍有不足,特别是在精细空间推理能力上存在显著缺陷。FAIR团队由图灵奖得主Lecun Yan与Saining Xie教授领 导,通过研究发现,感知模块的性能直接决定了VLM模型的整体表现。例如,他们通过简单混合CLIP和DINOv2这两个感知模 型,就显著提高了VLM的空间推理能力。

同样,硅谷初创公司Pi、斯坦福大学与伯克利大学的研究团队也通过类似的模型融合技术提升了机器人在端到端操作任务中的表 现。然而,现有的空间感知模型依然无法完全满足具身智能对空间智能的高标准需求。
随着AI技术范式变革从数字世界向物理世界逐步扩展,感知性能的突破成为推动空间智能发展的关键技术支柱。空间智能基础模 型的进步,不仅是技术层面的升级,更是实现具身智能的必经之路。这一趋势表明,具身智能需要从根本上提升感知能力,才能 在复杂的物理世界中完成精准操作与推理。 随着技术进步,空间智能也成为投融资领域的热点方向。例如,由“AI教母”李飞飞教授创立的World Labs,在短短几个月内便以 构建大型世界模型为目标,专注于生成、感知并交互3D世界。World Labs的定位是解决人工智能领域中最复杂且核心的问题—— 空间智能。其成立后迅速完成高额融资,公司估值超过10亿美元(约70亿人民币),投资方包括Andreessen Horowitz、英伟达 旗下NVentures,以及DeepMind首席科学家Jeff Dean和AI教父Geoffrey Hinton等知名科学家。这表明,空间智能领域已吸引了 全球顶尖资本与技术团队的关注。
根据Omdia的最新报告,全球空间计算市场预计在2024年达到45亿美元,并在2029年突破100亿美元,复合年均增长率 (CAGR)高达18%。与此同时,泰伯智库预测,到2030年,中国元宇宙市场规模将达到8500亿元,其中与空间计算相关的市场 规模将达到3400亿元,占元宇宙市场的40%。这些数据表明,空间智能不仅是人工智能发展的重要技术方向,更将成为推动元宇 宙生态和相关产业发展的核心动力。
三、人形机器人
近年来,人工智能、传感器、三维仿真和大模型技术的突破,显著提升了人形机器人在复杂环境中的感知、自主性和交互能力。 通过集成先进的语音识别、情感识别、自然语言处理等技术,人形机器人实现了更自然的人机交互,并具备了更高效的自主导航 和任务执行能力。以特斯拉Optimus、优必选Walker等国内外知名品牌为代表的产品,已经展示了卓越的性能,标志着人形机器 人从实验室迈向实际应用。与此同时,生成式AI技术的崛起进一步加速了人形机器人的商业化进程,使其在家庭服务、教育娱 乐、智能导览等领域表现出巨大的市场潜力。 政府的重视和政策支持为人形机器人行业提供了坚实的发展环境。例如,《北京市促进通用人工智能创新发展的若干措施》提 出,要推动具身智能系统的研究与应用,突破复杂环境中的关键技术;《人形机器人产业研究报告》预测,到2029年,中国人形 机器人市场规模将达到750亿元,占全球市场的32.7%,位居世界第一。此外,2024年前十个月,全球人形机器人领域共记录了 69起融资事件,融资总额超过110亿元人民币。资金的持续注入为行业研发提供了强劲动力,推动了更多高度灵活且具智能交互 能力的机器人产品落地。
市场研究数据显示,全球人形机器人市场规模在未来几年内将快速增长,到2025年有望达到数十亿美元,2029年将进一步突破 千亿美元。在中国,2024年机器人市场总规模预计达到4802亿元,其中人形机器人作为重要分支将成为高端制造领域的重要增 长点。随着技术进步和生产成本的逐步降低,预计人形机器人将广泛应用于工业、物流、医疗、教育、娱乐等领域,推动相关行 业的智能化转型升级。
四、大规模仿真训练平台
大规模仿真训练平台市场正迎来前所未有的增长。智能机器人在非结构化环境中完成复杂任务的需求促使企业加快开发迭代,而 仿真平台为此提供了高效、低成本的解决方案,成为行业竞争的重要工具。高性能算力平台的涌现为仿真平台的发展奠定了硬件 基础。 新一代虚实融合仿真平台通过整合真实数据与仿真环境,大幅提升仿真精度,并缩短了智能机器人从研发到部署的周期。生成的 高保真训练数据使机器人能够更好地适应复杂的真实环境,显著增强其实际操作的可靠性和性能。这类平台已成为现代智能机器 人开发的重要趋势。仿真平台的应用已从传统机器人领域扩展至自动驾驶、智能制造、医疗、航空航天、智慧城市等多个行业。 例如,虚实结合的仿真技术支持无人驾驶系统在极端天气等复杂环境中的测试,并为工业机器人优化精密装配流程提供了训练工 具。这种多场景适应能力极大拓宽了仿真平台的市场潜力。
大规模仿真平台正与5G通信、云计算、数字孪生等前沿技术深度结合,推动了智能机器人性能的跨越式发展。这种技术融合不仅 提升了仿真训练的实时性和扩展性,还为机器人在复杂环境中的自主学习与高效执行创造了更多可能性。未来,随着仿真训练平 台技术的不断升级,其在智能机器人开发中的地位将更加突出。基于仿真的高效训练流程将进一步加快机器人迭代速度,并为复 杂环境中的具身智能机器人提供坚实的技术基础。通过提升性能极限,大规模仿真技术将加速人工智能与机器人技术的深度融 合,成为推动智能系统商业化应用的重要驱动力。
五、触感灵巧手
截至2024年上半年,全球机器人灵巧手市场容量达到66.69万只,市场规模达15.07亿美元,同比增长超过13%。与此同时,具身 触觉领域也展现出强劲的发展势头,截至2024年前三季度,披露的融资事件达35起,累计融资金额高达31.5亿元。这些数据凸显 了机器人灵巧手和具身触觉智能在全球范围内的快速发展以及市场对其的高度关注。 随着大语言模型、人工智能和具身智能技术的进步,人形机器人对手部精细操作的需求显著增加,推动了灵巧手市场的需求增 量。国家和地方政府也高度重视这一领域的发展,出台多项支持政策,助力行业创新。在此背景下,多家企业推出了一系列灵巧 手产品,推动其向智能化和拟人化方向演进。同时,具身触觉技术作为人工智能发展的重要方向,凭借触觉感知与交互能力的不 断突破,进一步拓展了灵巧手和智能体的应用场景。
灵巧手和具身触觉技术相辅相成,共同赋能机器人更智能、更精细的操作能力。灵巧手作为机器人与环境交互的重要部件,通过 拟人级别的高级触觉传感器与智能算法,实现对物体形态、质地、温度等属性的精准感知与操作。这不仅提高了工业制造中的效 率和精准度,还在医疗康复、危险环境作业、太空探索等领域展现出广泛的应用潜力。而具身触觉技术则通过对多模态信息(如 压力、湿度、震动等)的融合与解析,为机器人提供实时反馈,优化交互方式,进一步提升了复杂任务中的操作精度。例如,触 觉感知能够在工业场景中优化精密装配流程,在医疗领域确保远程手术的安全性和可靠性。
近年来,触觉感知技术的进步体现在传感器设计、感知模型以及开发平台的创新上。例如,Meta推出的Digit Plexus平台将指尖 与手掌传感器整合,为制造业和医疗领域的触觉控制提供更高精度;腾讯Robotics X实验室的人居环境机器人则结合触觉与视觉 技术,为人类提供个性化的辅助服务。这些技术的迭代不仅增强了机器人的环境适应能力,还推动了从工业制造到智能服务、医 疗康复等多领域的场景拓展。 投融资热潮进一步加速了灵巧手与具身触觉技术的商业化落地。众多行业巨头和技术团队积极布局这一领域,例如戴盟机器人专 注于视触觉传感器与多模态操作模型的研发,迅速获得资本青睐。根据IDTechEx预测,触觉技术市场规模将在2024年至2035年 间以复合年增长率增长,2035年将达到71亿美元。这表明,灵巧手与具身触觉技术不仅是未来人工智能系统的重要技术支柱,还 将在解决劳动力短缺、提升生产效率、优化用户体验等方面发挥重要作用。
展望未来,随着人工智能、物联网、5G等技术的深度融合,灵巧手和具身触觉技术将不断突破技术边界,推动人机交互模式的变 革。从工业制造到家庭服务,从医疗康复到特种作业,这些技术将在更多场景中实现落地应用,为智能制造与人性化服务注入新 动能,引领全球人工智能迈向更加智能、精细化的新时代。