常用工具 医生入驻 免费问医生

机器人也能纯视觉控制?MIT华人博士团队登上Nature主刊

2025-08-05 22:38:03 来源:家累千金网   

预计2025中国动力电池出货超470GWh

电子发烧友网报道(文/梁浩斌)“纯视觉”的机器概念在近几年的智能驾驶领域被提到的次数不少,特斯拉、人也人博小鹏、视觉士团上以及传闻准备重组的控制刊极越,都早已全面押注到“纯视觉”的队登智能驾驶技术。一些智驾方案商为了推动产品落地,机器也正在加速推出纯视觉的人也人博方案,以降低系统成本。视觉士团上

而在机器人领域,控制刊传感器的队登应用一直都是业界研究的核心,包括3D ToF相机、机器激光雷达、人也人博毫米波雷达、视觉士团上触觉传感器、控制刊各种力矩传感器等,队登在目前主流的机器人领域都有广泛应用。

然而最近刊登在Nature主刊上的一篇论文,展示了一个机器人“纯视觉”方案。

传统机器人控制方案

传统机器人是由高刚度材料精密加工部件构成,在结构上,通过低公差关节连接,可以简化为理想化的刚性连杆运动学链。而为了让系统了解目前机器人的状态,就需要使用多种传感器进行监测,比如在每个关节配备高精度的传感器,像角度编码器等,实时测量关节的状态变化,这些数据可以用于完整重建机器人的3D位姿,再通过基于动力学模型设计控制算法(如PID、MPC),将期望运动轨迹转换为执行器指令。

论文中提到,传统的机器人控制方案存在局限性。首先是依赖机器人预设的结构和传感器,要求机器人必须具有离散关节和嵌入式传感器,无法适用于缺乏传感器的软体或混合材料机器人。

其次,在使用柔性结构的机器人中,需要解决大变形、粘弹性、材料疲劳等复杂问题,传统的基于连续介质力学的模型计算成本过高,很难实现实时控制。同时,传统的模型无法处理关节间隙或者制造公差导致的非线性动态。

另外,因为模型对于机器人公差的要求非常高,依赖精密制造和高性能材料,成本过高,开发周期长,不利于机器人的普及。

“纯视觉”机器人控制方案有什么优势?

该论文由麻省理工学院(MIT)的多位研究人员合作完成,其中论文前三作分别是李思哲、张安南和陈博远,均于MIT计算机科学与人工智能实验室(CSAIL)攻读博士学位。

那为什么会想到用“纯视觉”来构建机器人控制系统?论文团队提到,这项工作的灵感是来自于人类感知,人类通过用游戏控制器来控制机器人,可以在几分钟内就学会拾取和放置物体,而我们唯一用到的传感器就是眼睛。

在论文中,该“纯视觉”机器人控制方案是使用了名为Visuomotor Jacobian Field(视觉运动雅可比场)的技术。这是一种机器学习方法,可以使用单个视频摄像头获得的数据来控制机器人。

首先,团队使用12个消费级RGB-D视频摄像头捕获的、执行随机生成命令的多视图视频训练了框架,无需人工注释或专家定制即可学习控制新机器人。在进行训练后,这个方法仅使用单个视频摄像头就能控制机器人执行期望的动作。
wKgZPGh2JD6ABLASAAM6m-vNGPg749.png
其中,视觉运动雅可比场的框架主要包含两个关键部分,首先是一个基于深度学习的状态评估模型,这个模型可以仅通过单一视频流就可以推断出机器人的三维状态,编码了它的三维几何形状和微分运动学,即可以确认在任何可能得指令下,机器人在三维空间中任何点的移动方式。

其次是一个逆动力学控制器,在二维图像空间或三维空间中一密集的方式将期望的运动参数化,实时计算并输出机器人控制指令。研究团队发现,将演示轨迹参数化为密集的点运动是控制各种类型机器人系统的关键,因为可变形和灵巧机器人的运动不能被单个三维框架上指定的刚性变换很好地约束,参数化使得广泛的系统可以模仿基于视频的演示。
wKgZPGh2JEeAbLylAAW7QFugYIc135.png
最终,通过该方法获得了跨平台的机器人控制能力。团队在使用16自由度的商用Allegro灵巧手进行测试时,关节角度误差可以小于3°,指尖位置误差小于4mm;使用3D打印的15气动通道软体手时,可以实现精准抓取工具,并具备抗遮挡能力;在采用剪切拉胀材料的HSA柔性腕平台上应用时,附加350g负重后仍实现7.3 mm精度;采用3D打印的Poppy教育机械臂,零部件公差较大的情况下,误差可以小于6 mm。

另外该方案能够实现无专家干预以及机器人的泛化能力,可以自动发现机器人的运动学结构,无需标注执行器与部件的对应关系。同时训练数据虽然仅包含随机的命令,但可以泛化到未被训练的运动。

采用该方案进行机器人控制,可以显著降低机器人自动化的门槛,降低机器人控制成本。其中关键创新在于将传统机器人控制的建模问题转化为基于视觉的自监督学习问题,为生物启发式机器人的实际部署开辟了新路径。




希望以上内容对您有帮助。

阅读全文
相关推荐
休闲视频推荐精选问答
养生文章推荐
办公家具未来发展新战略-

5月份物价持续平稳运行

办公家具未来发展新战略-
近年来,中国办公家具行业在不断的转型与变革中快速成长,无论国内还是外销前景都普遍看好。然而,在如此庞大的市场需求面前,办公家具行业的总体现状却难以与之匹配:市场竞争无序、同质化严重、设计能力普遍较
两湾建设十八公司领导同广西玉林市兴业县委副书记、县长会谈

沪消保丨直播间、短视频售卖商品货不对板需重视 上海市消保委发布2025年一季度投诉分析

两湾建设十八公司领导同广西玉林市兴业县委副书记、县长会谈
12月13日,两湾建设十八公司董事长黄军同广西玉林市兴业县委副书记、县长王永坚会谈,双方围绕高铁兴业南站正式运营前的准备工作进行交流。 黄军汇报兴业南站配套基础设施建设情况。他表示,高铁
今日股市复盘总结 6月23日股市复盘行情

对比蓝医保,星相守的这些优势非常明显

今日股市复盘总结 6月23日股市复盘行情
今日大小指数再度呈现分化格局,创业板指5连阳,创3月底以来反弹新高,两市成交额连续四个交易日突破万亿。科技题材依旧是当下的主线,半导体、锂电等趋势板块持续受到资金追捧。板块方面科技题材依旧是当下的主线
疑似谷歌Pixel 10 Pro Fold渲染图曝光:继续厚重路线,设计落后了

陕西省护理质控中心专家组到汉阴县人民医院开展护理质量及县质控中心工作调研

疑似谷歌Pixel 10 Pro Fold渲染图曝光:继续厚重路线,设计落后了
现在大折叠手机的发展趋势是什么?做轻做薄,不仅是国内的折叠屏是这个设计思路,就连最新的三星Galaxy Z Fold7也开始向着轻薄化路线前进了。但相比之下,谷歌似乎并没有跟进这个方向,近期最新出现了
“悬浮楼梯”安装存隐患 消保委化解楼梯安装纠纷

我国绿电绿证交易量超1800亿千瓦时

“悬浮楼梯”安装存隐患 消保委化解楼梯安装纠纷
中国消费者报合肥讯记者陶维)近年来,“网红悬浮楼梯”因其造型简单个性、未来感的设计风格吸引越来越多的消费者采用,但如果安装不规范则可能留下安全隐患。近日,安徽省消保委和合肥市消保委联合调解一起楼梯安装
贸易商态度剖析:谨慎乐观从何而来?

陕西省护理质控中心专家组到汉阴县人民医院开展护理质量及县质控中心工作调研

贸易商态度剖析:谨慎乐观从何而来?
全文要点:空上期精彩回顾:来源 |CCTD中国煤炭市场网编辑 |徐赫阳更多资讯/分析/解读👇声明:本文系转载自互联网,请读者仅作参考,并自行核实相关内容。若对该稿件内容有任何疑问或质疑,请立即与铁甲网
新品首发楸韵系列 让家中充满极简轻奢的味道

告别选择困难症!瓷砖胶十大品牌推荐,装修业主的安心之选-

新品首发楸韵系列 让家中充满极简轻奢的味道
新品首发楸韵系列 让家中充满极简轻奢的味道春华楸实 韵藏万象1985-2023 跨越时光长河陪伴万物走过生长的时节春生,夏长,秋收,冬藏酝酿一场久违的重逢老朋友,于你一起见证品牌新章。溯源·人文风情
中国稀土集团与广晟有色的关系

中国花游世锦赛勇夺冠 《黑神话:悟空》配乐显风采

中国稀土集团与广晟有色的关系
中国稀土集团有限公司以下简称“中国稀土集团”)与广晟有色金属股份有限公司以下简称“广晟有色”)的关系主要体现在股权控制、业务整合及战略协同上,具体关系及稀土业务安排如下:一、股权控制关系实际控制人变更
玻璃市场早报,市场研究

华为与厦门软件职业技术学院签署全面合作框架协议

玻璃市场早报,市场研究
6月1日报道:昨日,国内浮法玻璃市场盘整操作,观望气氛浓。华北沙河非标市场窄幅波动;华东地区成交一般,山东零星企业价格上调;华中、华南地区以稳为主,下游接盘刚需为主;西南西北市场趋于稳定,个别市场仍存
逆天16384级压感、还带灯效!华为旗舰手写笔M

5月份物价持续平稳运行

逆天16384级压感、还带灯效!华为旗舰手写笔M
今日下午,华为新款旗舰级平板电脑MatePad Pro 12.2英寸2025款正式发布,除了双层OLED柔光屏、麒麟9020芯片外,还带来了一款更加强大的手写笔——M-Pencil Pro。根据该产品