机器人研究论文 — 通俗摘要 | BotMarket

Robotics今天

OpenReLoc：基于开放词汇理解的物体级相机重定位

OpenReLoc 利用开放词汇物体匹配和 LLM 描述，从单张图像鲁棒估计相机位姿，在真实室内场景中优于封闭词汇方法。

Zhaopeng Cui, Jiarui Hu, Jingbo Liu, Boming Zhao +6

Warehouse今天

视觉语言模型赋予仓库机器人上下文感知语义地图

研究人员构建了一个结合SLAM、SAM和视觉语言模型的管道，为仓库机器人创建上下文语义地图，能识别物体并判断其是否可移动。

Marvin Rüdt, Hao Pang, Constantin Enke +2

AI今天

InSight：机器人如何无需人类帮助学习新技能

InSight使机器人能够通过VLM推理识别缺失基元并生成训练数据，自主获取新操作技能。

Maggie Wang, Lars Osterberg, Stephen Tian +3

Robotics昨天

机器人从可扩展的人类手部数据中学习物理推理

Jiaming Liu, Yinxi Wang, Chenyang Gu +15

Robotics昨天

LIBERO-Safety基准测试：对视觉-语言-动作机器人进行物理与语义安全评估

Rongxu Cui, Zongzheng Zhang, Jingrui Pang +11

AI昨天

AutoDex：全自动灵巧抓取数据采集系统，每小时超75次试验

AutoDex是一个端到端自主系统，无需人工干预即可收集物理标定的灵巧抓取试验——在100个日常物品上生成3,593次真实世界抓取尝试，每小时75次试验。

Mingi Choi, Gunhee Kim, Jisoo Kim +4

Robotics前天

新型有限元框架以空前力精度模拟触觉传感器

TaCauchy将基于有限元的力计算集成到Isaac Sim中，为视觉触觉传感器提取完整柯西应力张量。

Hengfei Zhao, Yifan Xie, Junhao Gong +6

Robotics前天

ARC：自适应鲁棒估计在实时定位中处理异常值与未知噪声

Alexandre Hadji-Thomas, Andrew Stirling, James R. Forbes

Robotics前天

慢大脑，快规划器：当AI视觉反应迟缓时如何保证机器人安全

Zhenghao "Mark'' Peng, Honglin He, Quanyi Li +2

Robotics3天前

GroundControl：基于轨迹一致性不确定性预测视觉语言智能体导航失败

GroundControl通过检测目标导向运动的统计显著偏离，利用轨迹一致性不确定性预测视觉语言智能体导航失败。

Nastaran Darabi, Divake Kumar, Sina Tayebati +2

Robotics3天前

快速人类注意力预测实现实时注视引导无人机导航

GazeLNN实时预测人类视觉注意力以引导无人机相机控制，在Jetson Orin NX上以45 FPS实现最新水平的注视预测。

Fatma Youssef Mohammed, Grzegorz Malczyk, Kostas Alexis

Robotics3天前

新运动规划算法使连续体机器人更具韧性

Oxana Shamilyan, Ievgen Kabin, Zoya Dyka +2

AI5天前

新注意力机制将机器人位姿视为群元素，性能显著提升

Przemyslaw Musialski

Robotics5天前

从人类指尖演示生成特定任务的机器人手

我们优化机器人手，使人类拇指-食指指尖运动在逆运动学下可复现

Sha Yi, Nicklas Hansen, Xueqian Bai +3

Robotics5天前

MemoryWAM：持久记忆让机器人动作模型更快更智能

大多数机器人动作模型会忘记几秒前发生的事情，导致它们在需要回忆过去事件的任务中失败。MemoryWAM引入了一种混合持久记忆系统，让机器人世界动作模型能够回忆长期上下文。

Sizhe Yang, Juncheng Mu, Tianming Wei +8

AI6天前

新算法UBP2利用不确定性从偏好中学习机器人奖励

Mohamed Nabail, Leo Cheng, Jingmin Wang +1

Robotics6天前

随我而动：将日常人类视频转化为灵巧机器人数据

Bhawna Paliwal, Haritheja Etukuru, William Liang +3

Robotics6天前

基于多视角3D接地VLM推理的零样本长时程灵巧操作

基于多视角3D接地VLM推理的零样本长时程灵巧操作框架，可复用原子动作基元支持工具使用任务。

Jisoo Kim, Sangwon Baik, Taeksoo Kim +4

Robotics7天前

EBench：新基准测试诊断移动操作机器人的核心能力

EBench是一个包含26个任务的基准测试，从五个能力维度诊断移动操作策略，而非单一成功率。

Ning Gao, Jinliang Zheng, Xing Gao +22

Robotics7天前

MOCHI Cleans Up Noisy Multi-Human Object Interaction Data

Jiye Lee, Yonghun Choi, Jungdam Won

BotPapers

OpenReLoc：基于开放词汇理解的物体级相机重定位

视觉语言模型赋予仓库机器人上下文感知语义地图

InSight：机器人如何无需人类帮助学习新技能

机器人从可扩展的人类手部数据中学习物理推理

LIBERO-Safety基准测试：对视觉-语言-动作机器人进行物理与语义安全评估

AutoDex：全自动灵巧抓取数据采集系统，每小时超75次试验

新型有限元框架以空前力精度模拟触觉传感器

ARC：自适应鲁棒估计在实时定位中处理异常值与未知噪声

慢大脑，快规划器：当AI视觉反应迟缓时如何保证机器人安全

GroundControl：基于轨迹一致性不确定性预测视觉语言智能体导航失败

快速人类注意力预测实现实时注视引导无人机导航

新运动规划算法使连续体机器人更具韧性

新注意力机制将机器人位姿视为群元素，性能显著提升

从人类指尖演示生成特定任务的机器人手

MemoryWAM：持久记忆让机器人动作模型更快更智能

新算法UBP2利用不确定性从偏好中学习机器人奖励

随我而动：将日常人类视频转化为灵巧机器人数据

基于多视角3D接地VLM推理的零样本长时程灵巧操作

EBench：新基准测试诊断移动操作机器人的核心能力

MOCHI Cleans Up Noisy Multi-Human Object Interaction Data