常用工具 医生入驻 免费问医生

机器人也能纯视觉控制?MIT华人博士团队登上Nature主刊

2025-08-05 22:40:38 来源:家累千金网   

三部门:拟在医疗领域开展扩大开放试点工作

电子发烧友网报道(文/梁浩斌)“纯视觉”的机器概念在近几年的智能驾驶领域被提到的次数不少,特斯拉、人也人博小鹏、视觉士团上以及传闻准备重组的控制刊极越,都早已全面押注到“纯视觉”的队登智能驾驶技术。一些智驾方案商为了推动产品落地,机器也正在加速推出纯视觉的人也人博方案,以降低系统成本。视觉士团上

而在机器人领域,控制刊传感器的队登应用一直都是业界研究的核心,包括3D ToF相机、机器激光雷达、人也人博毫米波雷达、视觉士团上触觉传感器、控制刊各种力矩传感器等,队登在目前主流的机器人领域都有广泛应用。

然而最近刊登在Nature主刊上的一篇论文,展示了一个机器人“纯视觉”方案。

传统机器人控制方案

传统机器人是由高刚度材料精密加工部件构成,在结构上,通过低公差关节连接,可以简化为理想化的刚性连杆运动学链。而为了让系统了解目前机器人的状态,就需要使用多种传感器进行监测,比如在每个关节配备高精度的传感器,像角度编码器等,实时测量关节的状态变化,这些数据可以用于完整重建机器人的3D位姿,再通过基于动力学模型设计控制算法(如PID、MPC),将期望运动轨迹转换为执行器指令。

论文中提到,传统的机器人控制方案存在局限性。首先是依赖机器人预设的结构和传感器,要求机器人必须具有离散关节和嵌入式传感器,无法适用于缺乏传感器的软体或混合材料机器人。

其次,在使用柔性结构的机器人中,需要解决大变形、粘弹性、材料疲劳等复杂问题,传统的基于连续介质力学的模型计算成本过高,很难实现实时控制。同时,传统的模型无法处理关节间隙或者制造公差导致的非线性动态。

另外,因为模型对于机器人公差的要求非常高,依赖精密制造和高性能材料,成本过高,开发周期长,不利于机器人的普及。

“纯视觉”机器人控制方案有什么优势?

该论文由麻省理工学院(MIT)的多位研究人员合作完成,其中论文前三作分别是李思哲、张安南和陈博远,均于MIT计算机科学与人工智能实验室(CSAIL)攻读博士学位。

那为什么会想到用“纯视觉”来构建机器人控制系统?论文团队提到,这项工作的灵感是来自于人类感知,人类通过用游戏控制器来控制机器人,可以在几分钟内就学会拾取和放置物体,而我们唯一用到的传感器就是眼睛。

在论文中,该“纯视觉”机器人控制方案是使用了名为Visuomotor Jacobian Field(视觉运动雅可比场)的技术。这是一种机器学习方法,可以使用单个视频摄像头获得的数据来控制机器人。

首先,团队使用12个消费级RGB-D视频摄像头捕获的、执行随机生成命令的多视图视频训练了框架,无需人工注释或专家定制即可学习控制新机器人。在进行训练后,这个方法仅使用单个视频摄像头就能控制机器人执行期望的动作。
wKgZPGh2JD6ABLASAAM6m-vNGPg749.png
其中,视觉运动雅可比场的框架主要包含两个关键部分,首先是一个基于深度学习的状态评估模型,这个模型可以仅通过单一视频流就可以推断出机器人的三维状态,编码了它的三维几何形状和微分运动学,即可以确认在任何可能得指令下,机器人在三维空间中任何点的移动方式。

其次是一个逆动力学控制器,在二维图像空间或三维空间中一密集的方式将期望的运动参数化,实时计算并输出机器人控制指令。研究团队发现,将演示轨迹参数化为密集的点运动是控制各种类型机器人系统的关键,因为可变形和灵巧机器人的运动不能被单个三维框架上指定的刚性变换很好地约束,参数化使得广泛的系统可以模仿基于视频的演示。
wKgZPGh2JEeAbLylAAW7QFugYIc135.png
最终,通过该方法获得了跨平台的机器人控制能力。团队在使用16自由度的商用Allegro灵巧手进行测试时,关节角度误差可以小于3°,指尖位置误差小于4mm;使用3D打印的15气动通道软体手时,可以实现精准抓取工具,并具备抗遮挡能力;在采用剪切拉胀材料的HSA柔性腕平台上应用时,附加350g负重后仍实现7.3 mm精度;采用3D打印的Poppy教育机械臂,零部件公差较大的情况下,误差可以小于6 mm。

另外该方案能够实现无专家干预以及机器人的泛化能力,可以自动发现机器人的运动学结构,无需标注执行器与部件的对应关系。同时训练数据虽然仅包含随机的命令,但可以泛化到未被训练的运动。

采用该方案进行机器人控制,可以显著降低机器人自动化的门槛,降低机器人控制成本。其中关键创新在于将传统机器人控制的建模问题转化为基于视觉的自监督学习问题,为生物启发式机器人的实际部署开辟了新路径。




希望以上内容对您有帮助。

阅读全文
相关推荐
娱乐视频推荐精选问答
养生文章推荐
高云翔案件最新进展,王晶保释被拒原因竟是这个!受害女主身份曝光

AI工具导航网站,未来的发展前景怎么样?

高云翔案件最新进展,王晶保释被拒原因竟是这个!受害女主身份曝光
高云翔性侵这一案子,连续好几个月,成为网络热议话题,前几天董璇缴纳高达1465万的保释金,把高云翔保释出狱,而高云翔保释后首次在董璇陪伴下出现在警察局“打卡”,董璇见到记者后略
厦门曾厝垵西里继续封闭 持续至4月30日

区领导开展节前安全工作检查

厦门曾厝垵西里继续封闭 持续至4月30日
厦门日报讯记者 许晓婷)昨日,记者从厦门公安公众服务网获悉,因曾厝垵西坑水库流域排水防涝一期工程建设需要,1月13日零时起至4月30日24时,曾厝垵西里曾厝垵西里187号至曾厝垵西路口段)继续封闭施工
开启工程机械智能化新时代,网易灵动“灵掘”具身智能模型全球首发

【数字匠人】伊顿李海平:以系统思维打造AI时代“全可靠、全链条”的电能底座

开启工程机械智能化新时代,网易灵动“灵掘”具身智能模型全球首发
7月29日,2025世界人工智能大会暨人工智能全球治理高级别会议简称“WAIC 2025”)在上海圆满闭幕。据WAIC官方披露,这场全球科技盛宴各项指标均创历史新高:截至7月2
饼干食品生产加工废水处理设备

区第三届“工会杯”五人制足球赛火热开赛

饼干食品生产加工废水处理设备
饼干食品生产加工废水处理设备-乐中环保 标签: 添加时间:2023-08-03 浏览次数:2171 随着饼干食品行
元宵佳节,福海板材感恩相伴,与您共赴美好新程

嫦娥六号着陆区高精度地形数据集构建—新闻—科学网

元宵佳节,福海板材感恩相伴,与您共赴美好新程
元宵佳节,福海板材感恩相伴,与您共赴美好新程责编:小玉 时间:2025-02-10 热度:40580
铸造铝合金光谱分析标准物质:提升铸造铝合金光谱精度

百亿水利工程——华阳河蓄滞洪区工程建设持续推进 宿松新闻网

铸造铝合金光谱分析标准物质:提升铸造铝合金光谱精度
在铸造行业中,铝合金因其轻质、高强度和良好的耐腐蚀性而广受欢迎。然而,确保铝合金材质的质量与性能,离不开精确的光谱分析。作为一名在材料检测领域深耕多年的专业人士,我深知铸造铝合金光谱分析标准物质对于提
时尚小鱼:以深耕之姿拓版图 蓬勃之势启新章

三部门:拟在医疗领域开展扩大开放试点工作

时尚小鱼:以深耕之姿拓版图 蓬勃之势启新章
七月盛夏,时尚小鱼以稳健的步伐在时尚版图上再落五子——陕西汉中店、陕西渭南店、内蒙古呼市店、重庆武隆店、河北衡水店相继璀璨启幕。从西北高原到华北平原,从西南山城到内蒙草原,新店以统一的品牌美学与沉浸式
瑞众福临门(盛世尊享)年金保险(分红型)怎么领钱?收益+条款

收藏艺术品象征着一个人的文化品位和社会地位,富豪藏家大量加入引发市场巨变 收藏资讯

瑞众福临门(盛世尊享)年金保险(分红型)怎么领钱?收益+条款
导读: 瑞众福临门盛世尊享)年金保险分红型)是一款兼顾终身年金保障与分红收益的保险产品,不仅提供终身年金领取、身故/全残保障,还包含投保人
旅游/出差必看!2025年高性价比短期意外险推荐,教你选对保障

解释核心机理仅需6个字!95后同济博士一作发表重要突破—新闻—科学网

旅游/出差必看!2025年高性价比短期意外险推荐,教你选对保障
导读: 旅行、出差途中,意外从不打招呼。航班延误打乱行程、突发疾病急需救治、行李丢失令人焦心…… 此刻,一份贴心的短期意外险,就是你的 “
智慧农业LORA五网口两串口网关的功能应用

泸州市考察交流团到绥江县进行考察交流

智慧农业LORA五网口两串口网关的功能应用
在智慧农业中,具备多网口与串口功能的LoRa网关虽未明确提及“五网口两串口”,但可基于LoRa网关的通用特性进行功能应用分析)发挥着重要作用,其功能应用主要体现在环境监测与数据采集、远程控制与设备管理