인간 손끝 시연을 통한 작업 특화 로봇 손 생성

인간 손끝 시연을 통한 작업 특화 로봇 손 생성

Sha Yi, Nicklas Hansen, Xueqian Bai, Carmelo Sferrazza, Michael T. Tolley +1명 더

4 분 읽기2026년 6월 19일

이는 하드웨어와 제어를 공동 최적화하는 공동 설계(co-design)를 자연스럽게 시사합니다. 공동 설계는 강력하지만, 설계 공간과 제어 공간이 결합되어 있어 어렵습니다. 손의 형상을 변경하면 동작에 가장 잘 맞는 제어기가 달라지고, 제어기를 변경하면 유용해 보이는 설계가 달라집니다. 이러한 결합은 특히 목표가 단일 스크립트 동작이 아니라 광범위한 조작 행동을 재현할 수 있는 손일 때 크고 비볼록한 탐색 문제를 만듭니다.

우리는 설계와 제어 사이의 비대칭성을 활용합니다. 훈련 중에는 하드웨어 매개변수와 관절 궤적을 모두 최적화할 수 있습니다. 그러나 배포 시에는 하드웨어가 일단 제작되면 고정되는 반면, 제어기는 온라인에서 조정 가능합니다. 따라서 제작 후 간단한 제어기를 사용할 경우, 동일한 제어기 하에서 설계를 학습해야 합니다. 이 연구에서는 별도의 복잡한 정책을 각 후보 설계에 대해 학습하는 대신, 역기구학(inverse kinematics) 하에서 인간의 엄지-검지 손끝 동작이 재현 가능하도록 로봇 손을 최적화합니다.

인간 손 동작은 이 문제에 대한 자연스러운 행동 사전(prior)입니다. 인간 시연은 다양하고 풍부하며, 로봇이 수행할 것으로 예상되는 조작 행동을 대표합니다. 동시에 인간 손은 기계적으로 복제하기 어렵습니다. 실제 로봇 손은 크기, 비용, 배선, 견고성, 전자 통합 등의 제약으로 인해 훨씬 적은 수의 액추에이터로 작동해야 합니다. 리타겟팅(retargeting)은 인간 동작을 기존 로봇 손에 매핑할 수 있지만, 선택된 구현체에 의해 도입된 근본적인 운동학적 불일치를 제거할 수는 없습니다. 대신 우리는 인간 손끝 궤적을 사용하여 구현체 자체를 생성합니다.

접근법: 역기구학을 통한 구현체 탐색

인간 모션 캡처에서 손 설계 과정까지의 파이프라인 다이어그램

핵심 통찰은 하드웨어 설계가 배포 시 사용될 동일한 제어기 하에서 최적화되어야 한다는 것입니다. 우리는 인간 엄지-검지 손끝 궤적이 역기구학(IK)만을 사용하여 정확하게 재현될 수 있도록 손 운동학 매개변수를 탐색하는 문제로 공식화합니다. 이는 각 후보 설계에 대해 별도의 복잡한 정책을 학습할 필요를 없앱니다.

탐색 공간에는 관절 위치, 링크 길이, 관절 유형(회전, 프리즈매틱, 4절 링크), 액추에이터 구성이 포함됩니다. 우리는 IK 제어 하에서 로봇 손끝 위치와 인간 시연 사이의 평균 추적 오차를 최소화하는 설계를 최적화합니다.

범용 6-DoF 손 생성

엄지와 검지 운동학을 갖춘 최적화된 6-DoF 손 설계

회전 관절의 전체 공간에서 최적화할 때, 이 방법은 엄지와 검지 배열을 가진 6자유도 손을 발견합니다. 이 범용 설계는 인간 엄지-검지 손끝 동작의 광범위한 커버리지를 달성합니다. 관절 축과 링크 길이가 인간 시연에서 발견되는 다양한 핀치 및 정밀 파지를 재현하는 데 적합한 운동학적 구조가 자연스럽게 나타납니다.

6-DoF 손은 다양한 조작 행동을 수행할 수 있는 기준선 역할을 하지만, 동작의 하위 집합만 필요한 작업에는 복잡성이 불필요할 수 있습니다.

4절 링크를 사용한 작업 특화 저-DoF 손

공간 4절 모방 관절을 사용한 작업 특화 손 설계

더 제한된 동작 요구사항을 가진 작업을 위해, 공간 4절 링크를 도입하여 액추에이터 수를 줄일 수 있습니다. 이러한 모방 관절은 자유도 사이에 수동 결합을 생성하여 추가 모터 없이 구조화된 동작 궤적을 인코딩합니다.

최적화는 작업 관련 손끝 궤적을 정확하게 재현할 수 있는 2-4 자유도만 가진 손 설계를 발견합니다. 4절 링크는 인간 시연에서 관찰된 자연스러운 동작 패턴에 매핑되는 특정 링크 길이 비율로 설계됩니다. 이 접근법은 기계적으로 더 단순하고, 제조 비용이 저렴하며, 더 견고하면서도 대상 조작 작업을 수행할 수 있는 손을 생성합니다.

행위자 기반 상각 설계

각 새로운 작업에 대해 처음부터 하드웨어 최적화를 해결하는 대신, 행위자 기반 초기화 방법을 도입합니다. 신경망은 인간 손끝 시연 집합이 주어졌을 때 좋은 초기 손 설계를 예측하도록 훈련됩니다. 이는 작업 간 탐색 과정을 상각(amortize)하여 작업 특화 메커니즘 설계를 생성하는 속도를 크게 높입니다.

행위자는 동작 특징에서 운동학 매개변수로의 매핑을 학습하여 최적에 가까운 후보 손 설계를 빠르게 제안할 수 있습니다. 이러한 초기 설계에서 미세 조정하는 것은 무작위 또는 기본 구성에서 시작하는 것보다 훨씬 적은 최적화 반복을 필요로 합니다.

조작 작업 평가

정밀 핀치, 측면 파지, 도구 사용을 포함한 다양한 조작 행동에 대해 생성된 손을 평가합니다. 6-DoF 범용 손은 모든 테스트 동작에서 평균 오차 2mm 미만으로 인간 동작 궤적과 일치합니다. 작업 특화 저-DoF 손은 대상 작업에서 유사한 성능을 달성하면서도 액추에이터를 50-75% 적게 사용합니다.

최적화된 손은 기존 손 설계와 비교하여 픽 앤 플레이스 및 조립 작업의 물리 시뮬레이션에서 개선된 성능을 보여주며, 인간 동작 기반 하드웨어 최적화가 더 나은 실제 조작 능력으로 이어짐을 확인합니다.

자주 묻는 질문

이 접근법은 기존 로봇 손 설계 방법과 어떻게 다른가요? 기존 방식이 먼저 손을 설계한 후 제어기를 개발하는 것과 달리, 이 방법은 제작 후 사용되는 동일한 역기구학 제어기 하에서 손 운동학을 최적화하여 하드웨어 구조가 원하는 동작을 자연스럽게 지원하도록 합니다.

이 방법이 손끝 조작을 넘어선 작업을 위한 손을 생성할 수 있나요? 현재 프레임워크는 손끝 위치 추적에 초점을 맞추고 있지만, 향후 연구에서는 접촉력, 물체 형상 및 상호작용, 하중 처리를 포함하도록 목적 함수를 확장할 수 있습니다.

이 방법으로 어떤 유형의 로봇 손을 생성할 수 있나요? 광범위한 동작 커버리지를 가진 범용 6-DoF 손과 공간 4절 링크를 사용하여 수동 결합을 통해 구조화된 동작을 인코딩하는 작업 특화 저-DoF 손을 모두 생성할 수 있습니다.

행위자 기반 초기화가 설계 과정을 어떻게 가속화하나요? 행위자는 인간 시연으로부터 좋은 초기 손 설계를 예측하도록 학습하여 하드웨어 탐색을 작업 간에 상각하며, 각 새 설계를 처음부터 시작하는 것보다 훨씬 적은 최적화 반복을 필요로 합니다.

🍪 쿠키 환경설정

성능 측정을 위해 쿠키를 사용합니다. 개인정보 처리방침