Esto sugiere naturalmente el co-diseño: optimizar conjuntamente hardware y control. El co-diseño es potente, pero también difícil porque el espacio de diseño y el espacio de control están acoplados. Cambiar la geometría de una mano altera el controlador que mejor se adapta a un movimiento, y cambiar el controlador modifica qué diseños parecen útiles. Este acoplamiento crea un problema de búsqueda grande y no convexo, especialmente cuando el objetivo no es un único movimiento predefinido, sino una mano capaz de reproducir una amplia clase de comportamientos de manipulación.
Aprovechamos una asimetría entre diseño y control. Durante el entrenamiento, tanto los parámetros de hardware como las trayectorias articulares pueden optimizarse. Sin embargo, en la implementación, el hardware es fijo una vez fabricado, mientras que el controlador sigue siendo ajustable en línea. Por lo tanto, si se va a utilizar un controlador simple tras la fabricación, el diseño debe aprenderse bajo ese mismo controlador. En este trabajo, optimizamos manos robóticas para que los movimientos de las yemas del pulgar e índice humanos sean reproducibles mediante cinemática inversa, en lugar de aprender una política compleja separada para cada diseño candidato.
El movimiento de la mano humana es un prior conductual natural para este problema. Las demostraciones humanas son diversas, abundantes y representativas de los comportamientos de manipulación que se espera que realicen los robots. Al mismo tiempo, las manos humanas son mecánicamente difíciles de replicar: las manos robóticas prácticas deben operar con muchos menos actuadores debido a restricciones de tamaño, costo, cableado, robustez e integración electrónica. El re-targeting puede mapear movimientos humanos a una mano robótica existente, pero no puede eliminar el desajuste cinemático subyacente introducido por la configuración elegida. En su lugar, utilizamos trayectorias de las yemas de los dedos humanos para generar la propia configuración.
Enfoque: Búsqueda de configuración mediante cinemática inversa

La idea central es que el diseño del hardware debe optimizarse bajo el mismo controlador que se utilizará en la implementación. Formulamos el problema como la búsqueda de parámetros cinemáticos de la mano tales que las trayectorias de las yemas del pulgar e índice humanos sean reproducibles con precisión utilizando únicamente cinemática inversa (IK). Esto evita la necesidad de aprender una política compleja separada para cada diseño candidato.
El espacio de búsqueda incluye ubicaciones de articulaciones, longitudes de eslabones, tipos de articulaciones (revoluta, prismática y mecanismos de cuatro barras) y configuraciones de actuadores. Optimizamos para diseños que minimicen el error de seguimiento promedio entre las posiciones de las yemas de los dedos del robot y las demostraciones humanas bajo control IK.
Generación de una mano de 6 GDL de uso general

Al optimizar sobre el espacio completo de articulaciones revolutas, el método descubre una mano de 6 grados de libertad con una disposición de pulgar e índice. Este diseño de uso general logra una amplia cobertura de los movimientos de las yemas del pulgar e índice humanos. La estructura cinemática emerge de forma natural con ejes articulares y longitudes de eslabones que hacen que la mano sea adecuada para reproducir la variedad de agarres de precisión y pinza presentes en las demostraciones humanas.
La mano de 6 GDL sirve como referencia que puede realizar una amplia gama de comportamientos de manipulación, pero su complejidad puede ser innecesaria para tareas que solo requieren un subconjunto de movimientos.
Manos especializadas de bajos GDL con mecanismos de cuatro barras

Para tareas con requisitos de movimiento más restringidos, podemos reducir el número de actuadores introduciendo mecanismos espaciales de cuatro barras. Estas articulaciones miméticas crean un acoplamiento pasivo entre los grados de libertad, codificando trayectorias de movimiento estructuradas sin necesidad de motores adicionales.
La optimización descubre diseños de mano con tan solo 2-4 grados de libertad que aún pueden reproducir con precisión las trayectorias de las yemas relevantes para la tarea. Los mecanismos de cuatro barras se diseñan con relaciones de longitud de eslabón específicas que se corresponden con los patrones de movimiento naturales observados en las demostraciones humanas. Este enfoque produce manos mecánicamente más simples, más baratas de fabricar y más robustas, manteniendo la capacidad de realizar las tareas de manipulación objetivo.
Diseño amortiguado basado en actor
En lugar de resolver la optimización del hardware desde cero para cada nueva tarea, introducimos un método de inicialización basado en actor. Se entrena una red neuronal para predecir buenos diseños iniciales de mano a partir de un conjunto de demostraciones de movimiento de las yemas de los dedos humanos. Esto amortigua el proceso de búsqueda entre tareas, haciendo que generar diseños de mecanismos específicos para cada tarea sea sustancialmente más rápido.
El actor aprende un mapeo desde características del movimiento hasta parámetros cinemáticos, lo que permite al sistema proponer rápidamente diseños de mano candidatos cercanos al óptimo. El ajuste fino a partir de estos diseños iniciales requiere muchas menos iteraciones de optimización que comenzar desde configuraciones aleatorias o por defecto.
Evaluación en tareas de manipulación
Evaluamos las manos generadas en una variedad de comportamientos de manipulación, incluyendo agarre de precisión, agarre lateral y uso de herramientas. La mano de uso general de 6 GDL iguala las trayectorias de movimiento humano con un error promedio inferior a 2 mm en todos los movimientos probados. Las manos especializadas de bajos GDL logran un rendimiento comparable en sus tareas objetivo mientras utilizan entre un 50 y un 75% menos de actuadores.
Las manos optimizadas también demuestran un rendimiento mejorado en simulación física de tareas de pick-and-place y ensamblaje en comparación con diseños de mano existentes, confirmando que la optimización del hardware basada en movimiento humano se traduce en una mejor capacidad de manipulación en el mundo real.
Preguntas frecuentes
¿En qué se diferencia este enfoque de los métodos existentes de diseño de manos robóticas? A diferencia de los enfoques tradicionales que primero diseñan una mano y luego desarrollan controladores, este método optimiza la cinemática de la mano bajo el mismo controlador de cinemática inversa utilizado después de la fabricación, asegurando que la estructura del hardware respalde naturalmente los movimientos deseados.
¿Puede este método generar manos para tareas más allá de la manipulación con las yemas de los dedos? El marco actual se centra en el seguimiento de la posición de las yemas, pero el trabajo futuro podría extender el objetivo para incluir fuerzas de contacto, geometrías e interacciones de objetos, así como manejo de cargas.
¿Qué tipos de manos robóticas puede producir este método? Puede generar tanto manos de uso general de 6 GDL con amplia cobertura de movimiento como manos especializadas de bajos GDL que utilizan mecanismos espaciales de cuatro barras para codificar movimiento estructurado mediante acoplamiento pasivo.
¿Cómo acelera la inicialización basada en actor el proceso de diseño? El actor aprende a predecir buenos diseños iniciales de mano a partir de demostraciones humanas, amortiguando la búsqueda de hardware entre tareas y requiriendo muchas menos iteraciones de optimización que empezar desde cero para cada nuevo diseño.
