1. Figure 03:人形机器人进厂打工
2026 年 4 月,Figure AI 正式发布第三代产品 Figure 03,并宣布与宝马集团扩大合作——在南卡罗来纳州 Spartanburg 工厂部署 50 台人形机器人,用于车身组装、质检和仓储物流。这是目前全球最大规模的商业化人形机器人部署案例。
Figure 03 身高 170cm,体重 60kg,有效载荷 25kg,续航 5 小时。最关键的进步在于其搭载的 Helix VLA(视觉-语言-动作)模型,实现了从自然语言指令到全身精细动作的端到端控制——"把那个蓝色箱子放到第二层货架上"这样的模糊指令,机器人可以自主完成。
| 参数 | Figure 02 | Figure 03 |
|---|---|---|
| 自由度 | 41 | 48 |
| 灵巧手自由度 | 16 | 22 |
| 续航 | 5h | 5h(可换电) |
| AI 模型 | GPT-4o 集成 | Helix VLA 原生 |
| 量产状态 | 试产 | 月产 100 台 |
"The goal isn't just to build a robot that can walk — it's to build one that can work. Figure 03 is our first production-ready model."
— Brett Adcock, Figure AI CEO, April 2026
2. Optimus Gen 3:马斯克的万台量产计划
Tesla 在 2026 年 5 月的 AI Day 上展示了 Optimus Gen 3,并宣布德州超级工厂内部已经开始使用 Optimus 进行电池分拣和线束安装,部署数量超过 200 台。Elon Musk 更是给出了激进的量产时间表:2027 年产能达到 1 万台/月。
Gen 3 核心升级
Optimus Gen 3 最大的变化在于执行器完全自研——Tesla 设计了专用的旋转执行器和线性执行器,扭矩密度提升 40%,响应速度提升 60%。灵巧手自由度从 Gen 2 的 11 个提升至 22 个,每根手指可以独立弯曲,能够完成穿针引线级别的精细操作。
另一个关键突破是 FSD 技术迁移。Optimus 的视觉感知和路径规划模块直接复用了 Tesla FSD v14 的神经网络架构,使其在工厂环境中实现了厘米级定位和实时避障。
3. 中国力量:宇树、智元、达闼
中国在人形机器人赛道上同样进展神速:
- 宇树科技 H1:全球首款实现后空翻的全尺寸人形机器人。2026 年 Q1 全球出货超 500 台,单价 9.9 万美元,主要销往科研机构和高校。搭载自研 M107 关节电机,峰值扭矩 360N·m。
- 智元机器人(稚晖君团队):远征 A2 机器人已完成新一轮融资,估值超 30 亿美元。采用了独特的模块化设计——手、臂、躯干可以独立升级替换。
- 达闼科技:Cloud Ginger 2.0 走"云端大脑"路线——机器人的 AI 推理在云端完成,本体只负责执行,大幅降低了硬件成本。已在上海多家养老院试点部署。
值得注意的是,中国在人形机器人核心零部件(伺服电机、减速器、力传感器)领域的国产替代进展显著——绿的谐波的谐波减速器、汇川技术的伺服系统已进入多家机器人厂商供应链。
4. 核心技术栈:从 VLA 到灵巧手
2026 年的具身智能技术栈可以概括为三个层面的突破:
大脑:VLA 大模型
视觉-语言-动作(Vision-Language-Action)模型是具身智能的"操作系统"。不同于传统机器人依赖精确编程,VLA 模型允许机器人理解自然语言指令,自主分解任务并规划动作序列。Google DeepMind 的 RT-3、Figure 的 Helix、字节跳动的 GR-2 是当前三大主流框架。
小脑:全身运动控制
基于强化学习的运动控制策略已经能够处理高度动态的环境变化。波士顿动力的 Atlas 可以在碎石堆上跑步,宇树 H1 可以在被踢踹后自主恢复平衡——这些能力的背后是 域随机化训练和Sim-to-Real 迁移技术的成熟。
灵巧手:22 自由度的精密操作
人手有 27 个自由度,而之前最先进的机器人手只有 11-16 个。2026 年多个团队突破了 22+ 自由度的灵巧手设计,结合触觉传感器阵列(如 MIT 的 GelSight 和 Shadow Robot 的 Dexterous Hand),机器人已经可以完成翻书、倒水、插拔 USB 等日常动作。
5. 商业化路径与挑战
尽管技术进展令人振奋,人形机器人的大规模商业化仍面临几个关键挑战:
- 成本:目前单台人形机器人成本在 5-15 万美元,离"比汽车便宜"的目标仍有距离。Tesla 的目标是将 Optimus 成本降至 2 万美元以下。
- 可靠性:工业场景要求 99.9% 以上的无故障运行时间,目前的机器人尚未达到这个标准。Figure 03 的 MTBF(平均无故障时间)约为 200 小时。
- 安全性:人形机器人在人类环境中工作,需要确保不会对人员造成伤害。ISO 13482(服务机器人安全标准)正在更新以覆盖人形机器人场景。
- 社会接受度:从伦理到就业影响,人形机器人的普及将引发深刻的社会讨论。2026 年 3 月,欧盟发布了全球首个《人形机器人伦理框架》草案。
总的来说,2026 年是具身智能从"技术验证"到"商业试水"的关键转折点。接下来的 2-3 年,我们可能会看到人形机器人在制造业、物流和养老领域的规模化部署。具身智能的 ChatGPT 时刻,或许比人们预想的更近。
Figure 03 进宝马工厂这个案例太有说服力了!这才是人形机器人真正的用武之地——不是跳舞拍视频,而是实实在在替代重复性体力劳动。
中国在人形机器人硬件上进展很快,但 VLA 模型这块和美国还有差距。宇树 H1 的运动能力很强,但智能程度还需要提升。