目前,在该领域已经有多个AI实验室致力于机械手训练,例如OpenAI的Dactyl机器手、DeepMind的RGB堆叠技术(RGB-Stacking)等,都在一定程度上促进了机器人行业的发展。
MIT CSAIL研究人员提出的程序框架可以让机械手操纵超过2000个不同物体的方向,利用简单的“师生”训练方法,在模拟环境中训练”教师“网络,再应用到现实世界的“学生”中,解决机械手技术的复杂问题。
该论文将在2021年机器人学习会议(Conference on Robot Learning,CORL)上发表。
一、从魔方到2000多种不同物体,任意玩转
OpenAI 2019年10月15日在官网博客发布了Dactyl机械手的视频,视频内容是Dactyl机械手在约4分钟的时间里成功还原了一个三阶魔方,这是在机械手控制领域,从定向任务编程迈向更通用AI技术的重要一步。
▲Dactyl机械手还原魔方视频(GIF来源为YouTube)
2021年10月12日DeepMind发布RGB堆叠技术(RGB-Stacking)对机械手进行强化学习训练,这是一个基于视觉的学习系统,评估多个研究对象的行为和动作来提高机械手能力。
▲RGB堆叠技术机械手训练过程(图片来源为VentureBeat)
MIT CSAIL的科学家们也一直致力于让机器提高模仿人类的能力,他们创建了一个更大的程序框架:无论机械手朝上还是朝下,都可以重置2000多个物体的方向。从杯子到金枪鱼罐头、奶酪盒子等,甚至可以延伸到生活中不常见的物体,这个程序框架都可以帮助机械手以特定的方式,在合适的位置快速拾取和放置物体。
此前机械手通常只能完成单一任务或者只能在垂直位置上移动,而现在机械手可以具备灵巧的“手部动作”,有助于满足物流和制造行业一些常见的需求。例如将物品装入插槽中进行装配,或灵活操纵距离更远的工具。MIT CSAIL的团队使用了具有24个自由度的拟人机械手,证明了该程序框架可以在未来转移到真正的机器人系统上。
▲MIT CSAIL研究团队的机械手演示动画(GIF来源为GitHub)
二、从零重力到正常条件,机械手性能提高
MIT CSAIL博士生、Improbable AI Lab研究小组首席研究员陈涛(Tao Chen)说:“在工业中,由于控制简单,最常用的是平行爪夹持器,如下图所示。但实际上它无法处理我们在日常生活中看到的许多工具。即使用该夹持器控制钳子也很困难,因为它不能灵活地只移动其中一个手柄。我们的程序框架将允许多指机械手灵巧地操纵此类工具,这为机械手应用开辟了一个新领域。”
▲平行爪夹持器(图片来源为YouTube)
机械手操纵物体时需要控制大量电机,并且手指与物体之间的接触状态也在频繁变化,因此,机械手重置物体方向一直是一个具有挑战性的技术难题。该程序框架需要通过2000多个对象进行学习。
当机械手朝下时,问题就变得更加棘手。机械手不仅需要操纵物体,还需要克服重力使其不会掉落。
▲机械手朝下时操纵物体(GIF来源为GitHub)
该团队发现一种简单的方法可以解决复杂的问题。他们使用了深度学习的无模型强化学习算法,意味着该程序框架必须从与环境的交互中找出价值函数,以及所谓的“师生”训练方法。
为此,研究人员利用物体和机械手的信息对“教师”网络进行训练,这些信息无法在现实世界中获得,只能在模拟环境中获得,例如指尖的位置或物体移动速度。
为了确保机械手可以在模拟环境之外工作,“教师”网络学习到的内容将被提炼为现实世界中可以获取的观察结果,并提供给“学生”网络,例如摄像机捕获的深度图像、物体姿态和机械手的关节位置。
他们还使用了“重力课程”的学习方法,机械手首先在零重力环境中学习技能,然后慢慢地让控制器适应正常的重力条件,以这种形式训练机械手确实提高了其整体性能。
看似不是正常的学习过程,但被称为机械手“大脑”的单个控制器可以通过这种训练方法重新放置大量物体,即使这些物体它以前从未见过并且不知道形状。
三、机械手成功率受物体形状制约
麻省理工学院教授、该研究论文作者Pulkit Agrawal说:“我们最初认为,在机械手操纵物体时推断形状的视觉感知算法将是主要挑战。相反,我们的结果表明,机械手可以学习与形状无关的强大控制策略。这表明视觉感知对于操纵的重要性可能远不如我们习惯的思维方式重要,而更简单的感知处理策略可能就足够了。”
例如苹果、网球、弹珠等小的球形物体在用机械手重新放置时,其成功率接近100%。而对于勺子、螺丝刀和剪刀等更复杂的物体放置的成功率较低,只有约30%。
▲机械手操纵球形物体(GIF来源为GitHub)
由于其成功率因对象形状而有所偏差,该团队指出,在未来基于物体形状训练模型可以进一步提高机械手性能。
结语:简单方法解决机械手复杂难题
此次麻省理工学院研究小组推出的程序框架,可以帮助机械手重新定位不同物体,操纵机械手多指机械手使用多种复杂工具,并满足生产过程中的多种需求,开辟机械手应用的新领域。
该研究小组表示,由于高维驱动空间和手指与物体之间接触状态的频繁变化,手持物体重新放置方向一直是机器人技术中的一个具有挑战性的问题。用简单的“师生”方法训练机械手,巧妙的解决了这一复杂问题。
智东西(公众号:zhidxcom)
编译 | 程茜
编辑 | 李水青
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。