Facebook:不会“犯错”的机器人,不是“聪明”的机器人
在人们意识当中,犯错机器人按照开发者的不会不聪意愿而做出指定的动作似乎是一件理所应当的事,而且,器人机器人完成任务还要做到精准、机器迅速。犯错然而,不会不聪Facbook 的器人研究人员却不走寻常路,他们有意让机器人“犯错误”,机器这到底是犯错为什么呢?
让我们一起来看看吧。
“明知故犯”是不会不聪“智”也
在 Facebook 位于硅谷的新实验室里,有一个叫作 Sawyer 的机器机器人(来自已经倒闭的 Rethink Robotics 公司),它红黑相间的犯错手臂挥舞着,试图完成研究人员交给它的不会不聪任务。
按照指令,器人Sawyer 的手臂应该移动到右边一处固定位置,然而,Sawyer 把手臂抬高,然后偏离轨道,错开了指定位置,重新回到了原点;研究人员只好将 Sawyer 重置,让它继续完成之前的任务。这一次,Sawyer 的手臂确实往右移了,但就在非常接近指定位置的时候,它再一次偏离了运动轨道,回到了起始位置。两次任务都失败了。
或许有人会觉得 Sawyer 的“顽劣”行为令人抓狂。但就像兔子为了躲避猎鹰而迂回前进一样,Sawyer 看似笨拙的行为实际上是一种特殊的聪明。
Facebook 认为,无论是对于机器人的开发,还是 AI 的开发来说,这种聪明都至关重要。
强化学习让机器人更“聪明”
一般来说,开发者会编程机器人,让他们通过这些设定好的指令来执行动作,不过从某种程度上来说,这种方式有点死板。
而我们人类在学习上则要聪明得多。因为,即使是婴儿也明白,物体从视野中消失并不代表从世界上消失;玩具球可以滚来滚去,沙发却不行;长大后,人们能够学习驾驶,而不是撞车。
这一切都要归功于人类大脑里建立起来的世界模型。
Facebook 首席 AI 科学家 Yann LeCun 表示:
如果我们在悬崖边开车,方向盘只要往右转,汽车就会掉下去,所以,我们绝不会这样做。我们大脑里的世界模型会阻止我们自己做傻事。
Facebook 也在尝试为机器提供这种模式,Yann LeCun 补充道说,建立世界模型的系统是 AI 取得重大进展的下一个挑战。
实际上,Facebook 并不是第一个尝试让机器人学会自我移动的团队。
雷锋网注:上图为 Brett 机器人及其开发者 Pieter Abbeel
在加州大学伯克利分校,研究人员使用了一种名为强化学习(reinforcement learning)的技术,让双臂机器人 Brett 把方形钉子塞进一个方形洞里。
在此过程中,研究人员会让 Brett 尝试许许多多随机的动作:如果 Brett 更接近目标,系统就会给它“奖励”;如果 Brett 搞砸了,系统会给它“记过”。
这些记录,Brett 都会保存下来,然后经过多次迭代,它会越来越精准地找到方洞,并把钉子放进去。
创新的自我监督学习
而 Facebook 的尝试有点不同,Facebook AI 研究科学家 Franziska Meier 表示:
我们想尝试的是给机器人灌输好奇心的概念。
人类就是通过好奇心来认识世界的,比如,孩子们想知道猛拽猫尾巴会发生什么,所以他们会去做这种尝试。因此,Brett 是通过一点一点地靠近目标,来改进自己的动作,而 Facebook 的 Sawyer 则是靠近目标,然后故意偏离轨道。
Facebook 研究人员旨在让 Sawyer 自由地尝试非最佳动作,而不是奖励它不断取得的成功,即使这在当时看起来并不理性。Meier 说:
虽然 Sawyer 没有完成任务,但它给了我们更多的数据,我们通过这种方式获得的数据比传统的方式要多。
这个概念被称为自我监督学习——机器人尝试新行为并更新软件模型,从而帮助它预测自己的行为后果。
雷锋网注:上图为 Facebook 所说的“自我监督学习”的算法模型
这样做的目的是让机器能够更加灵活地去完成任务,或者说,更容易适应动态的人类环境。
比如,机器人要将架子上的杯子放到旁边的架子,最好的方法是将杯子直接平移,然而两个架子之间有隔板,这就需要机器人反复试验、反复犯错,直到它探索出更好的解决方案。
正如奥斯陆大学的机器人专家 Tonnes Nygaard 所说的那样:
如果我们一直执着于一个解决方案,我们可能会走进死胡同;我们更应该专注于探索更多新的解决方案。
模拟与现实之间的差距
一些研究人员通过模拟来教机器人完成任务——建立一个数字世界,再让其中的动画对象通过“犯错”的方式来完成任务。这种方法相对较快,因为当数字“机器”不受现实世界物理定律的约束,它们迭代的速度要快得多。
不过,虽然模拟更高效,但它并不能完美地反映真实世界,模拟动态人类环境的复杂性。
这就导致,机器人在模拟环境中能够完美匹配的理论,在现实世界中却不适用。在现实世界中做任何事情都可能更慢、更费力,但好处是,机器人能获得的数据更纯粹。
Facebook的人工智能研究科学家 Roberto Calandra 表示:
如果它在现实世界中行得通,那它就真的行得通。
毕竟,机器人在现实世界中要面对各种意想不到的麻烦,程序员不可能对每一个都预先进行编码。
AI 和机器人相得益彰
雷锋网注:上图是 Facebook 的六足机器人
从某种程度上来说,Facebook 的项目是 AI 和机器人的伟大融合。
虽然谷歌和亚马逊和 Facebook 等科技巨头已经大大推动了 AI 的发展,比如让机器进行图像识别,不过这个任务仍基于人们事先给图片贴好标签。不得不承认,机器还是不够聪明。
随着 AI 研究人员开始使用机器人作为平台来改进软件算法,这种情况开始发生变化。
例如,Facebook 教机器人独立完成一系列任务,这反过来可能会对开发 AI 助手有所启发,让它们能够更好地为用户服务。LeCun 说道:
如果机器人解决了一个问题,同理,它也能在另一种情况下解决这个问题。
简而言之就是,AI 正在让机器人变得更聪明,而机器人也在帮助推进 AI 的发展。
不过,Facebook 表示,目前,公司的这项研究并没有连接到特定的产品。不过,LeCun 说:
我们认为,机器人将在远程呈现中发挥重要作用。毕竟,Facebook 拥有 Portal 和 Oculus VR 系统。
雷锋网注:本文编译自 Wired
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
92975
-
浏览
377
-
获赞
1
热门推荐
-
买豪宅!涨薪!拜仁为凯恩拼了,1亿欧刷新纪录,热刺做了什么?
不管是球迷是否承认,如果热刺失去了凯恩的话,球队的竞争力将会出现大幅度的下滑,甚至沦落为英超中下游的球队。在热刺对阵矿工的热身赛上,凯恩上演了大四喜,帮助球队拿到了比赛的胜利,再次证明了自己的进攻实力隋朝到底是什么样的?隋炀帝也像影视中所知道的那样吗?
说起隋朝,我们似乎并不陌生。各种影视作品以及书籍中它出现的频率可不算低的了。“隋唐演义”,“隋唐英雄传”之类的,但是细想一下呢?隋朝出现的时候,身边还总是跟着一个唐朝。而隋朝与唐朝站在一起的时候,那就石质材料作为篆刻用材,明清以来为何多为印人所喜用?
印章材料,有铜、石、金、玉、木、牙、骨、砖、有机玻璃制品等。但作为篆刻艺术用材,还是以石质材料为主。因为石质印材,柔、脆、腻、坚适中,易于受刀,并能表现出特有的金石韵味,故明清以来多为印人所喜用。同时时尚的服装怎么介绍(服装穿搭介绍范文)
时尚的服装怎么介绍服装穿搭介绍范文)来源:时尚服装网阅读:231各种服装风格介绍第一种、百搭风格:百搭一般为单品,可以搭配各种衣服,很实用的单件服饰,一般都是比较基本的、经典的样式或颜色,如纯色系服装内维尔:若完成易主并支出合理,曼联有机会冲击英超第二
7月29日讯 曼联名宿内维尔接受了媒体的采访,被问及红魔新赛季的英超排名,内维尔发表了他的看法。内维尔表示:“一切都取决于资金预算,从俱乐部现任老板的模式来看,我认为也许他们能跻身前四,但不会有所提升李承乾是皇位继承人的不二人选,为何却失之交臂了?
李承乾是李世民和长孙皇后的嫡长子,如果没有意外的话,他是皇位继承人的不二人选。但是意外还是来临了,他因多种原因被废,与皇位失之交臂。下面趣历史就说说他不得宠的几个原因:摔断了腿,缺少帝王之相李承乾小时对于《清明上河图》的别浦津渡,现存宋代诗词有涉及吗?
《清明上河图》画中所描绘的河历来被认为是汴河,而很多人认为,这条河并不是正河,而是别浦,即用作渡口的自然河。周邦彦《兰陵王·柳》又有『渐别浦萦回,津堠岑寂』之句,其中的别浦,并非送别之浦,而是别通之浦在清朝《红楼梦》中,关于“冷香丸”的配方又是什么?
《红楼梦》第七回中说道,宝钗患了一种病,是从娘胎里带来的一股热毒,犯时出现喘嗽等症状。一个和尚给宝钗说了个“海上仙方儿”,这种药就叫“冷香丸”。自打宝钗服用后,倒也灵验。下面趣历史小编就为大家带来详细涉及直播带货、盲盒消费等热点问题 安徽省消保委发布第一季度投诉分析报告
中国消费者报报道陶维记者司宇萌)近日,安徽省消保委发布的第一季度投诉分析报告显示,2022年一季度,安徽省各级消保委共受理消费者投诉5384件,较去年同期上升了35.79%,为消费者挽回经济损失103杨玉环是爱着寿王李瑁的,那么她为何还会选择唐玄宗?
历史上对她美貌的赞歌一直滔滔不绝,的确,杨玉环美的惊心动魄,且有胆有才,几乎每个见过她的男人都拜倒在了她的石榴裙下。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!她与原配夫君李瑁的第一次见面是在宋太祖杯酒释兵权后,那些将领们的日子变成了什么样?
赵匡胤杯酒释兵权后,那些交出兵权的将领都有什么结局?下面趣历史小编就为大家带来详细的介绍,一起来看看吧!建隆元年末(960),宋太祖已平定李筠及李重进叛乱后,某天,他召见丞相赵普,询问为何唐末以来战争唐穆宗在位时期,唐朝如何失去政令归于一统的中兴成果?
大唐元和十五年(820年),唐宪宗李纯离世,其在位时间合计十五年。历史上唐宪宗在位的时期,李唐王朝展开了强力的削藩之战。以至于,到唐宪宗离世之时,包含“河朔三镇”在内的藩镇,悉数归于一统,史称“元和中Nike 最强市售跑鞋 ZoomX VaporFly NEXT% 官方定制服务开启
潮牌汇 / 潮流资讯 / Nike 最强市售跑鞋 ZoomX VaporFly NEXT% 官方定制服务开启2019年07月31日浏览:3825 继字幕哥战靴开启定制服隋文帝在临死之前,他到底传给了隋炀帝哪些好牌?
604年8月13日,开创了隋朝的隋文帝杨坚去世,他与独孤皇后的嫡次子杨广,继承了皇位,是为隋炀帝。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!隋炀帝是一个有着雄心壮志的皇帝。然而,他继位后,将丁谓在年轻时期,北宋著名文学家王禹偁是怎么评价他的?
丁谓相貌不佳,生一双斜眼,张目仰视,好像是个经常饥寒的人,相面的说他是“猴形”。小时顽劣,多亏有位姓郁的老先生对他严加管教,使他学业有所进步。后来,丁谓去拜访郁先生时说:“自己少时狭劣,多亏先生教诲,