编者按:本文来自微信群众号“新智元”(ID:AI_era),36氪经授权发布。
来历:Twitter、Reddit
修改:小芹、大明
近来,“OpenAI的机器手在4分钟内单手成功复原魔方”引起刷屏,可是,这一成就被闻名机器学习怀疑论者马库斯质疑了,马库斯逐条罗列OpenAI的误导性说法,机器学习圈却都撑OpenAI。
这几天,人工智能范畴最令人兴奋的发展莫过于“OpenAI 的机器手学会了单手解魔方”。
OpenAI 在 10月 15 日发布这一效果,当即引起很多谈论。转魔方的视频被张狂刷屏,仅 YouTube 的视频就有 20万观看,网友纷纷表明:人工智能机器人的一个新里程碑诞生了!这是机器人在机体灵敏性以及机器学习软件方面的腾跃!
OpenAI 运用强化学习和 Kociemba 算法练习神经网络来仿照处理魔方问题。
研讨人员专心于一个机器现在难以把握的问题:感知和灵敏的操作。他们练习神经网络来完结由法生成的复原所需的旋转和翻转,并开发了一种称为主动域随机化的新方法,该算法能够无休止地在仿真中生成越来越困难的环境,然后让神经网络在仿照环境中学习解魔方,再搬迁应用到实践国际。
“用机器手处理魔方”的背面有许多人手
OpenAI 练习类人机器手来解魔方的测验,早在 2017 年 5 月就开端了。之所以对解魔方情有独钟,是由于研讨人员以为,假如能成功练习这样一只机器手来完结杂乱的操作使命,就能为通用型机器人奠定根底。
OpenAI 一起公开了一个机器手解魔方的完好视频,能够看到,机器手灵敏地操作魔方,在约 4 分钟的时间里成功复原了一个三阶魔方。
机器手复原魔方的完好进程
可是,这一效果遭到了纽约大学心理学与认知科学教授、畅销书作家加里·马库斯(Gary Marcus)的质疑——OpenAI 宣称“处理”了魔方,真的是这样吗?马库斯以为 OpenAI 复原魔方的博客内容存在误导性,他说:
鉴于 OpenAI 依然没有更改关于“处理魔方”的误导性博客帖子(博客标题是“Solving Rubik’s Cube with a Robot Hand),所以我附上了具体的剖析,将他们的说法和暗示与实践所做的进行了比较。依我之见,这些误导性对大多数对非专业人士来说并不显着。
马库斯对 OpenAI“处理魔方”的 7 条质疑如下:
1、这不是神经网络处理的;而是有 17 年前史的符号算法做到的。
2、这种算法是先天的,而不是学习的。
3、强化学习在挑选转向哪个方向(即大多数人所说的处理了魔方)时不起作用。
4、所学到的是物体操作,而不是解魔方。
5、只要一个物体被操作,而且没有测验对其他目标的可推行性。
6、该物体安装了很多仪器(如蓝牙传感器),机器手也安装了 LED。
7、成功率只要 20%;魔方常常从机器人手中坠落。
他说:“我着重一下,这个效果自身给人留下了深入的形象,但描绘有误导,更恰当的标题应该是’用强化学习操作魔方’或‘灵敏的机器人手操作物体的发展”或相似的语句。”
OpenAI 联合开创人、机器人团队负责人 Woj Zaremba注意到马库斯的帖子,辩驳道:
1. 你的前三个观念是相同的。
2. 泛化是从仿照到实践,而不是从一个物体到另一个物体。
3. 咱们没有安装仪器得到的成果稍弱小一些。
4. 你坚信咱们不会将功用提升到 100%吗?
马库斯回应道:
1. 我的前两个观念彻底不同:先天性≠象征性。这些是不同的。第三个观念有一点堆叠,但并不显着。
2.我当然知道,可是为了稳健性,你需求推行到新物体上
3&4:我等待看到其他成果;我信赖你们终究会做得更好。
尽管是马库斯首先提出质疑,但不少人的回复并不附和马库斯的说法,有人回复道:
“这是一个有缺点的批评,根据对魔方的误解。魔方不是像围棋那样是一种能够学习的使命,而是需求回忆解法和娴熟操作的使命;人类玩魔方也遵从一种算法。”
马库斯仍表明:总的来说,他们(OpenAI)没有对我的观念做出回应,我的观念是那篇博客的结构与论文的内容不相契合,尽管我赞同这个作业很重要,但炒作是有误导性的。
网友谈论各不相谋,马库斯是言必有中,仍是吹毛求疵?
马库斯在 Twitter 上也供认这个研讨是个不错的研讨,但博客文章中的一些说法用词不当,和实践不符,具有误导性。
我的首要观念是,现在被热议的 OpenAI 的博客文章具有误导性;在技能论文中精挑细选出的东西并不能处理问题。我在推特上也具体讲了,文章自身的标题以及最初的结构都具有误导性。因而,文章自身有其自身的问题。
OpenAI 博客中的结束表明:“强化学习不只能够作为虚拟使命的东西,而且能够处理需求史无前例的灵敏性的实在国际中的问题。” 而马库斯以为,假如没有更强的泛化测验,就无法提出进一步的主张。5 个略有不同的 cube 试验,也不能让这个机械手学会拧紧螺丝,开锁或给衬衫系上纽扣。
所以,这些问题的处理实践上无从谈起。
Twitter 上有人对马库斯表明支撑,以为 OpenAI 的博客中的说法和实践的确存在实践差异。这种言过其实或许导致群众对技能的盲目信赖,从而形成消沉成果,比方特斯拉的撞车事端。
马库斯自己还发了个投票:
不过从 600 多人的投票成果看,支撑“处理魔方”应包含认知和操作两方面的占大多数。
在 Twitter 上不断 “放炮” 的一起,这场争辩的烽火不了防止地转到了其他渠道,比方 Reddit。
有网友转移了马库斯在 Twitter 上宣布的对 OpenAI 博客文章的 7 点具体定见,并配了贴图。但从网友谈论来看,支撑马库斯的不多。更多的人以为他这是过于严苛,字斟句酌,没事找事。
比方下边这位就说,他觉得马库斯写的这 7 点摘要比 OpenAI 博客文章更具误导性。
关注点 1-4:“神经网络没有处理问题;处理问题的是具有 17 年前史的符号 AI 算法。”
博客:“咱们运用强化学习和 Kociemba 的算法来挑选求解过程,练习神经网络来处理仿真中的魔方。”
关注点 5:“只要一个目标被操作,没有对其他目标的可推行性测验”
博客:测验运用了五种不同的原型,一个锁紧的仿照,一个面部立方体,一个完好的立方体,一个吉克魔方和一个 “惯例” 魔方。这篇文章从来没有宣称要处理魔方的问题。
关注点 6:“该物体已被植入很多设备(比方带有蓝牙功用传感器)。玩魔方的手上也装有 LED。”
博客:五个不同的原型中置入了不同等级的仪器。“惯例” 魔方没有置入任何设备,仅仅从中心正方形上切除小角,以消除对称性。
关注点 7:“成功率只要 20%;魔方常常坠落。”
博客:“尽管如此,咱们的机器人仍未完善其技能,由于只要 60%的成功几率(而最困难的情况下只要 20%的成功几率)。”
而且下文专门开了一段来说这个问题。
还有人以为,马库斯实在是过于挑剔了,过于纠结于实践上并不重要的问题。
我供认马库斯是一个能说会道的人。但我觉得他过于陈腐,以至于无视于眼前的实践问题,大多数外行人都有才能阅读文章的背面之意,检查研讨或博客文章的内容。
你能够去寻求学术上的准确,可是那些真实关怀这些东西的人很或许会陷入困境。咱们都对他列出的几条问题有所了解,但至少其间大多数。在这种情况下几乎是无关紧要的,乃至像 “泛化性”之类的重要观念,在机器人的高灵敏度这一首要问题面前,也显得不那么重要了。
我了解,不同的人会以不同的谨慎程度来对待这个问题,而且我也了解马库斯的忧虑,但我以为,关于 OpenAI 的公开批评过于挑剔,这些问题自身对这次谈论并不重要。
马库斯是谁?深度学习怀疑论者
Gary Marcus
加里·马库斯(Gary Marcus)是一位科学家、畅销书作家和企业家。他是 Robust.AI 公司的开创人和首席执行官,Geometric Intelligence 公司(2016 年被优步收买)的开创人兼首席执行官,出书作品包含《代数思想》、《荒诞脑科学(Kluge)》、《思想的诞生》等,最新作品是与 Ernest Davis 合著的《Rebooting AI :构建咱们能够信赖的人工智能》。
马库斯也是闻名的深度学习怀疑论者。作为认知心理学家,他一向高调参加人工智能争辩,与 Yann LeCun、AAAI 前主席 Thomas Dietterich 等 AI 大牛都打开过剧烈争辩。
他曾撰文批评深度学习(Marcus, 2018),称深度学习实践上并没处理什么问题。这篇文章引起了人工智能圈极大的反应,几天之内,不计其数的人在推特上宣布了自己对这个问题的观念,有些人热心支撑马库斯的观念(例如,“这是我多年来读到的有关深度学习和 AI 的最好的观念),有些相反(例如,“有考虑...... 但大部分都是过错的”)。
在那篇批评深度学习的文章中,马库斯归纳了深度学习的十大应战,直言深度学习自身尽管有用,但它不或许完结通用人工智能。他主张把深度学习视为“一种非遍及的处理方法,而仅仅一种东西。”
他说:“比较朴实的深度学习,我呼吁混合模型,不只包含深度学习的监督方式,还包含其他技能,例如符号处理(symbol-manipulation),以及无监督学习(它自身也或许被从头概念化)。我也敦促社区考虑将更多的内涵结构归入 AI 体系。”
Reddit:
https:///r/MachineLearning/comments/dkd4vz/d_gary_marcus_tweet_on_openai_still_has_not