这自然引出了协同设计:同时优化硬件和控制。协同设计功能强大,但也困难,因为设计空间和控制空间相互耦合。改变手的几何形状会改变最适合某种运动的控制器,而改变控制器又会改变哪些设计看起来有用。这种耦合形成了一个大规模、非凸的搜索问题,尤其是当目标不是单一脚本化运动,而是一只能复现广泛操作行为的手时。
我们利用了设计与控制之间的不对称性。在训练过程中,硬件参数和关节轨迹都可以优化。但在部署时,硬件一旦制造完成就固定了,而控制器仍可在线调整。因此,如果在制造后将使用简单控制器,那么设计应在该控制器下学习。在这项工作中,我们优化机器人手,使人类拇指-食指指尖运动在逆运动学下可复现,而不是为每个候选设计学习独立的复杂策略。
人类手部运动是这一问题的自然行为先验。人类演示多样、丰富,且代表了机器人需要执行的操作行为。同时,人类手部在机械上难以复制:由于尺寸、成本、布线、坚固性和电子集成等限制,实用的机器人手必须使用更少的驱动器。重定向可以将人类运动映射到现有的机器人手上,但无法消除所选实体带来的运动学不匹配。我们转而使用人类指尖轨迹来生成实体本身。
方法:通过逆运动学搜索实体

核心思想是硬件设计应在部署时使用的同一控制器下进行优化。我们将问题表述为搜索手部运动学参数,使得人类拇指-食指指尖轨迹仅通过逆运动学就能精确复现。这避免了为每个候选设计学习独立复杂策略的需要。
搜索空间包括关节位置、连杆长度、关节类型(旋转关节、移动关节和四杆机构)以及驱动器配置。我们优化设计,使机器人指尖位置与人类演示在逆运动学控制下的平均跟踪误差最小化。
生成通用6自由度手

当在完整的旋转关节空间上进行优化时,该方法发现了一款具有拇指和食指配置的6自由度手。这种通用设计实现了对人类拇指-食指指尖运动的广泛覆盖。运动学结构自然地出现,其关节轴和连杆长度使手非常适合复现人类演示中的各种捏取和精确抓取。
6自由度手作为基线可以执行广泛的操作行为,但对于仅需要部分运动的任务,其复杂度可能不必要。
具有四杆机构的专用低自由度手

对于运动要求更受约束的任务,我们可以通过引入空间四杆机构来减少驱动器数量。这些仿生关节在自由度之间创建被动耦合,无需额外电机即可编码结构化运动轨迹。
优化发现的手部设计具有仅2-4个自由度,仍能精确复现与任务相关的指尖轨迹。四杆机构设计有特定的连杆长度比,映射到人类演示中观察到的自然运动模式。这种方法产生的手机械上更简单、制造成本更低、更坚固,同时仍能执行目标操作任务。
基于Actor的摊销设计
无需为每个新任务从头解决硬件优化问题,我们引入了一种基于Actor的初始化方法。训练一个神经网络,根据一组人类指尖演示预测良好的初始手部设计。这跨任务摊薄了搜索过程,使生成任务特定的机构设计速度大幅提升。
Actor学习从运动特征到运动学参数的映射,使系统能够快速提出接近最优的候选手部设计。基于这些初始设计进行微调所需的优化迭代次数远少于从随机或默认配置开始。
在操作任务上的评估
我们在多种操作行为上评估生成的手部,包括精确捏取、侧向抓握和工具使用。6自由度通用手在所有测试运动中的平均误差小于2毫米,匹配人类运动轨迹。专用低自由度手在目标任务上实现了可比性能,同时使用的驱动器减少了50-75%。
优化后的手在物理仿真中的拾取与放置以及装配任务中,与现有手部设计相比表现出更好的性能,证实了基于人类运动的硬件优化可转化为更好的实际操作能力。
常见问题
该方法与现有的机器人手设计方法有何不同? 与传统先设计手部再开发控制器的方法不同,该方法在制造后使用的逆运动学控制器下优化手部运动学,确保硬件结构自然支持所需运动。
该方法能否生成用于指尖操作以外任务的手? 当前框架专注于指尖位置跟踪,但未来工作可将目标扩展到接触力、物体几何形状和交互以及负载处理。
该方法能生成哪些类型的机器人手? 它既可以生成运动覆盖广泛的通用6自由度手,也可以生成使用空间四杆机构通过被动耦合编码结构化运动的专用低自由度手。
基于Actor的初始化如何加速设计过程? Actor学习从人类演示中预测良好的初始手部设计,跨任务摊薄硬件搜索,与每次从头开始相比,所需优化迭代次数大大减少。
