在家庭厨房自主使用洗碗机,在办公室边移动边擦拭白板——这些人类习以为常的场景,对人形机器人来说,却是需要调动全身关节协同运作才能完成的“高难度挑战”
近日,UC Berkeley加州大学伯克利分校团队在arXiv平台发表了题为《Coordinated Humanoid Manipulation with Choice Policies》的研究论文,通过“模块化教学+智能选动作”的创新方案,成功破解了人形机器人全身协同的核心难题,为其走进真实人类环境铺平了道路。

阻碍人形机器人走进日常生活的“两大困境”
人形机器人一直被寄予厚望,有望在家庭、办公等非结构化环境中帮助人类完成日常工作,但长期以来,两个关键难题让它始终无法突破“实验室边界”,难以真正落地应用:
难题1. 全身协同难,“教学数据”获取贵且难
像使用洗碗机、移动擦黑板这类“长时连续任务”,需要机器人同时协调头部(定位目标)、双手(抓握操作)、腿部(移动平衡),实现类似人类“眼到手到、脚步稳健”的状态。
但传统的“遥操作”模式,需要操作员同时控制机器人几十个甚至上百个关节,不仅操作难度极高,操作员极易疲劳,还很难收集到高质量的演示数据——没有靠谱的“老师示范”,机器人自然学不会复杂的协同动作。
难题2. 动作“灵活度”与“反应速度”不可兼得
人类做同一个动作往往有多种可行方式(比如拿盘子,既可以五指托举,也可以拇指扣住边缘),这种“动作多样性”是机器人模仿人类的关键难点。
传统解决方案要么“太僵硬”:比如“行为克隆”技术只能让机器人学一种固定动作,遇到稍微变化的场景就会失灵;
要么“太迟钝”:比如“扩散策略”虽然能想到多种动作,但需要反复计算,延迟极高,根本跟不上实时操作需求(比如插盘子时错过最佳对准时机)。
双管齐下,用“模块化教学+智能选动作”破解困境
针对上述两大难题,伯克利团队没有走“复杂控制一刀切”的老路,而是提出了“模块化简化教学+多候选智能选动作”的组合方案,实现了“1+1>2”的效果:
1. 简化“教学”:模块化遥操作,普通人10分钟就能当“机器人老师”
团队把机器人的全身控制拆分成4个“傻瓜式”模块,操作员只需用VR手柄就能轻松操控,无需专业技能:

①手眼协调模块:头部会跟随手部动作转动,确保眼睛始终盯着操作区域;
②手部抓握模块:扣动扳机键就能实现“力量抓握”,拨动摇杆可微调拇指位置,精准控制力度;
③手臂跟踪模块:VR手柄的姿态会直接映射到机器人手臂,手柄动哪里,手臂就跟到哪里;
④全向移动模块:切换摇杆模式后,就能控制机器人前后、左右移动或转弯。
这种设计大幅降低了操作门槛,操作员10分钟就能上手,既能减少疲劳,又能快速收集大量高质量演示数据——相当于为机器人配备了高效的“专属家教”,让它不再盲目模仿。
2. 优化“决策”:Choice Policy算法,让机器人“秒选最优动作”
团队摒弃了传统方案的弊端,设计了“多候选动作生成+实时打分筛选”的机制:机器人会一次性生成多个可行的动作方案(比如拿盘子的3种不同姿势),再通过训练好的模型给每个方案打分,瞬间选出最优解。
这个过程就像人类做决定时“脑子里快速过几个选项,挑最稳妥的来”,既保留了动作的多样性,又保证了反应速度,完美解决了“僵硬”与“迟钝”的核心矛盾。

研究方法:算法与硬件双向协同,星动纪元人形机器人成关键支撑
这项研究的成功,离不开算法创新与硬件性能的深度配合。而星动纪元全尺寸双足人形机器人星动STAR1的硬件优势,恰好为算法落地提供了“强力支撑”,让“模块化教学”和“多候选决策”真正发挥作用:
