神奇!神经网络让盘算机自我进化,自我探索,逾越深度学习算法
作者:leye乐鱼娱乐app 发布时间:2021-12-17 00:23
本文摘要:盘算机进化出一条通往人类智能的新门路从生物学中借鉴的神经网络,其能力正在发生深刻的飞跃。神经网络是制造真正智能机械的最佳方式吗?踏脚石原理是一种将缔造力注入人工智能的方法。 2007年,中佛罗里达大学的盘算机科学家肯尼斯·斯坦利正在和他的学生建立的网站Picbreeder,突然一个外星人酿成了一辆赛车,改变了他的生活。在Picbreeder上,用户可以看到一组15张类似的图片,由几何形状或漩涡图案组成,所有这些都是同一个主题的变体。

leye乐鱼娱乐app

盘算机进化出一条通往人类智能的新门路从生物学中借鉴的神经网络,其能力正在发生深刻的飞跃。神经网络是制造真正智能机械的最佳方式吗?踏脚石原理是一种将缔造力注入人工智能的方法。

2007年,中佛罗里达大学的盘算机科学家肯尼斯·斯坦利正在和他的学生建立的网站Picbreeder,突然一个外星人酿成了一辆赛车,改变了他的生活。在Picbreeder上,用户可以看到一组15张类似的图片,由几何形状或漩涡图案组成,所有这些都是同一个主题的变体。有时,有些照片可能像一个真实的物体,像蝴蝶或脸。

用户可以选择一张图片,他们通常会点击他们认为最有趣的工具。一旦他们这样做了,一组新的图像将填充屏幕。

从这个有趣的探索中,一个充满理想的设计目录泛起了。斯坦利是人工智能领域“神经进化”的先驱,该领域使用生物进化原理来设计更智能的算法。使用Picbreeder,每张图像都是一个类似于神经网络的盘算系统的输出。

当一个图像生成时,它的底层网络突变为15个稍微差别的变体,每个变体都生成一个新的图像。斯坦利并不计划让Picbreeder发生任何特此外工具。他只是有一种预感,他或民众可能会学到一些关于进化某人工智能的知识。

有一天,斯坦利在网站上发现了一张类似外星面貌的工具,并开始进化它,选择了一个孩子和一个孙子等等。碰巧,圆圆的眼睛往下挪了挪,开始像汽车的轮子了。斯坦利也随着做了,并设计了一辆外观漂亮的跑车。他一直在想这样一个事实:如果他从零开始,而不是从外星人面貌开始,他可能永远也做不到这一点,他想知道这意味着什么,直接解决问题。

“这对我的整小我私家生发生了庞大的影响,”他说。他检察了Picbreeder上泛起的其他有趣的图片,追踪了它们的谱系,发现它们险些都是通过完全差别的方式进化而来的。“我一看到证据,就惊呆了。

”Picbreeder(左)生成的异形脸酿成了类似赛车的工具。斯坦利的认识造就了他所称的“踏脚石原理”,并由此设计出一种更充实地使用生物进化无穷缔造力的算法。这种脚踏式原理,就像中国先贤所说的“一生二,二生三,三生万物”,从一个源头开始,缔造出无穷无尽的事物。

踏脚石原理与生物进化进化算法已经存在很长时间了。传统上,它们被用来解决特定的问题。在每一代中,在某些指标上体现出最好的解决方案,好比控制一个两腿机械人的能力,被选中并发生子女。

虽然这些算法已经取得了一些乐成,但它们的盘算能力可能比深度学习等其他方法更强,深度学习近年来大受接待。踏脚石原理逾越了传统的进化方法。它不针对特定的目的举行优化,而是对所有可能的解决方案举行缔造性的探索。通过这样做,它取得了突破性的结果。

不久前,一个基于“踏脚石原理“的系统掌握了两款电子游戏,而这两款游戏却难倒了盛行的机械学习方法。在《自然》杂志揭晓的一篇论文中,人工智能公司DeepMind陈诉称,该公司乐成地将深度学习与多样化解决方案的演变联合起来。DeepMind率先将深度学习用于解决围棋等问题。

踏脚石原理的潜力可以用生物进化来类比。在自然界中,生命之树没有应有尽有的目的,用于一个功效的特性可能会发现自己会去做一些完全差别的事情。例如,羽毛可能是为了隔热而进化的,厥后才变得便于航行。

生物进化也是发生人类智能的唯一系统,这是许多人工智能研究者的终极梦想。由于生物学的跟踪记载,斯坦利和其他人已经开始相信,如果我们想要的算法能够尽可能轻松地在物理和社会世界中导航,我们需要模拟大自然的战术。

他们认为,我们必须让大量的解决方案着花效果,而不是硬编码推理规则,或让盘算机学会在特定的性能指标上取得高分。让盘算机优先思量新奇感或兴趣,而不是走路或说话的能力。他们可能会发现一条迂回的门路,一组垫脚石,最终能更好地走路和说话,而不是直接寻求这些技术。

从无到有,新奇探索继Picbreeder之后,斯坦利着手证明生物进化原则可以克服人们的争议:“如果我运行一个算法的创意到了这样一种水平,我不确定它会发生什么,这是很是有趣的,但这也难以商业化。”他希望通过简朴地沿着有趣的偏向追随想法,算法不仅可以发生多样化的效果,而且可以解决问题。

更斗胆的是,他的目的是证明完全无视一个目的比追求它会更快地实现目的。他通过一种叫做查新的方法做到了这一点。该系统由一个神经网络开始,它是一种被称为神经元的小盘算单元根据层状毗连排列。

一层神经元的输出通过具有差别“权重”的毗连通报到下一层。在一个简朴的例子中,输入数据,好比图像,可能被输入到神经网络中。随着来自图像的信息从一层通报到另一层,网络对其内容的提取越来越抽象。最后,最后一层盘算最高级此外信息:图像的标签。

对于优步人工智能实验室和中佛罗里达大学的盘算机科学家肯尼思•斯坦利来说,“踏脚石原则”解释了创新。在神经进化中,你首先给层间的权重分配随机值。

这种随机性意味着网络不会很好地完成它的事情。可是,从这种令人遗憾的状态中,你可以建立一组随机突变,子女神经网络的权重略有差别,并评估它们的能力。你保留最好的,发生更多的子女,然后重复。

更高级的神经进化计谋也会在神经元和毗连的数量和排列上引入突变。神经进化是一个元算法,一个设盘算法的算法。最终,这些算法很好地完成了它们的事情。为了测试踏脚石原理,斯坦利和他的学生Joel Lehman调整了选择历程。

新颖性的搜索并没有选择那些在一项任务中体现最好的网络,而是凭据它们与行为最相似的网络之间的差异来选择它们。在Picbreeder中,人们会奖励有趣的人。在这里,作为兴趣度的署理,新奇搜索将奖励新奇。

在一项测试中,他们将虚拟轮式机械人置于迷宫中,并对控制它们的算法举行进化,希望它们能找到出口的路径。他们从零开始举行了40次进化。

在一个比力法式中,机械人到出口的距离谁最短,如直线距离,40次中只有3次进化出获胜的机械人。完全不思量每个机械人离出口有多近的新颖性搜索,乐成了39次。

它乐成了,因为机械人设法制止了死胡同。他们不是面临出口,将头撞在墙上,而是探索不熟悉的领域,找到变通方法,并意外获胜。查新很重要,因为它彻底颠覆了一切,基本上就是问,当我们没有目的时,会发生什么。一旦斯坦利指出追求目的可能会成为实现这些目的的障碍,他就开始寻找将新奇搜索和详细目的联合起来的智慧方法。

这促使他和雷曼兄弟建立了一个反映自然进化壁龛的系统。在这种方法中,算法只与与它们相似的其他算法竞争。就像蠕虫不会与鲸鱼竞争一样,该系统维护着差别的算法利基,从中可以发生种种有前途的方法。

这种具有局部竞争的进化算法在处置惩罚像素、控制机械人手臂以及资助一个失去肢体的六足机械人快速适应其步态方面体现得很熟练,就像动物一样。这些算法的一个关键要素是它们培育了踏脚石。

他们不是不停地优先思量一个整体的最佳解决方案,而是维护一个多样化的充满活力的小众市场,其中任何一个都可以成为赢家。最好的解决方案可能来自于在差别的利基之间跳跃的谱系。

进化到赢对于现在在优步人工智能实验室事情的斯坦利来说,“踏脚石原则”解释了创新,如果你带着一台现代电脑回到已往,告诉人们放弃真空管,专注于条记本电脑,我们就什么都没有了。这也解释了进化,我们是由扁虫进化而来的,扁虫不是特别智慧,但却有两侧对称的特征。

现在还完全不清楚左右对称的发现是否与智力有关,更不用说与莎士比亚有关了,但确实如此。神经进化自己在已往十年中走了一条出乎意料的迂回之路。很长一段时间以来,它一直生活在其他形式的人工智能的阴影下。据德克萨斯大学奥斯汀分校的盘算机科学家说,它最大的缺点之一就是盘算量大。

在传统的机械学习中,当你训练一个神经网络时,它会逐渐变得越来越好。在神经进化中,权值是随机变化的,因此网络的性能可能在革新之前就会下降。另一个缺点是,大多数人都有自己想要解决的问题。一个优化兴趣度的搜索计谋可能会让你找到解决这个问题的缔造性方法。

但它可能会让你在走上正路之前就误入歧途。然而,没有什么计谋是完美的。在已往五年左右的时间里,人工智能研究的差别领域,如深度学习和强化学习,泛起了爆炸式的增长。在强化学习中,算法与情况相互作用,一个机械人在现实世界中导航,或者一个玩家在游戏中竞争,并通过重复试验来学习哪些行为会导致预期的效果。

乐鱼官网推荐

深度强化学习被DeepMind用来建立一个法式,它可以在围棋上打败世界上最好的棋手,许多人认为这一壮举还需要几年或几十年的时间。可是强化学习可能会陷入逆境。

稀疏或不频繁的奖励不能给算法足够的反馈,使它们能够朝着目的前进。欺骗性的奖励对阻碍恒久进步的短期收益举行奖励会让算法陷入死胡同。因此,只管强化学习可以在众多游戏中得分频繁,一些目的明确的游戏可以打败人类,但它们在其他缺乏这些功效的经典游戏中却一败下地。

在已往的一年里,基于踏脚石原理的人工智能终于乐成地解决了该领域恒久存在的一些挑战。《蒙特祖玛的复仇》)奖励了开放式探索。

在游戏《蒙特祖玛的复仇》中,巴拿马乔在地下迷宫中从一个房间导航到另一个房间,收集打开门的钥匙,同时避开敌人和蛇、火坑等障碍物。为了打破这个游戏,研究人员开发了一个系统,基本上可以让游戏四处闲逛,随机实验种种行动。

每一次他到达一个新的游戏状态,例如一个新的位置和一套新的产业,他把它归档到他的影象中,连同他所接纳的一系列行动。如果他厥后找到一条更快的路径到达谁人状态,它就会取代旧的内存。

在训练期间,巴拿马乔重复挑选其中一个存储状态,随机地探索一段时间,并将他发现的任何新状态添加到他的影象中。最终,其中一个状态就是赢得角逐的状态。

巴拿马乔在他的影象中有他所接纳的所有行动。他没有使用神经网络或强化学习,没有收集钥匙或靠近迷宫止境的奖励,只是随机探索和收集并毗连踏脚石的智慧方法。这种方法不仅击败了最好的算法,还打破了人类的游戏世界纪录。同样的技术,也就是研究人员所说的《去探索》,曾被用于在陷阱上击败人类专家!在这个游戏中,陷阱哈利在森林中寻找宝藏,同时避开鳄鱼和流沙。

没有其它机械学习人工智能的得分高于零。2019年1月,研究团队展示了AlphaStar,这款软件可以在庞大的电子游戏《星际争霸2》中击败顶级专业人士。AlphaStar进化出了一群相互竞争、相互学习的玩家。升级版的AlphaStar在一个平台上排名前0.2%的活跃玩家中压倒一切,成为第一个不受任何限制地登上热门电子竞技游戏顶层的人工智能。

开放式的发现可能是实现类人人工智能的最快方式。设计人工智能的人工智能到现在为止讨论的所有算法在缔造力方面都是有限的。AlphaStar只能想出新的星际争霸2战略。新颖性搜索一次只能在一个领域内找到新颖性,例如解决迷宫或行走机械人。

另一方面,生物进化发生了无穷无尽的新奇事物。我们有细菌、海带、鸟类和人类。

这是因为解决方案在进化,但问题也在进化,例如长颈鹿是对树木问题的回应。人类的创新也是如此。我们给自己制造贫苦,我们能把人送上月球吗?然后解决它们。

进化算法却不能给自己制造贫苦,无法自我缔造新的领域。数十年的研究告诉我们,这些算法不停地让我们感应惊讶,并胜过我们。为了反映这种问题与解决方案之间的开放式对话,研究团队公布了一个名为POET的算法,用于配对开放式开拓者。为了测试这个算法,他们进化了一群虚拟的两腿机械人。

它们还为机械人进化出了一群障碍训练场,包罗山丘、战壕和树桩。这些机械人有时会交流位置,实验新的地形。例如,一个机械人学会了拖着它的膝盖穿越平坦的地形。

然后它被随机转移到一个有短树桩的地方,在那里它必须学会直立行走。当它回到它的第一个障碍训练场时,它完成得更快了。一个间接的途径允许它通过从一个难题中学习技术来提高将它们应用于另一个。

诗人有可能设计出新的艺术形式,或者通过为自己发现新的挑战然后解决它们来举行科学发现。它甚至可以走得更远,这取决于它建设世界的能力。斯坦利说,他希望建设的算法在10亿年之后仍然可以做一些有趣的事情。斯坦利说,进化发现了视觉,发现了光互助用,发现了人类级此外智能,它发现了所有的一切,所有的一切都是在一个算法的运行历程中完成的。

捕捉到这一历程中哪怕是一丁点的变化,都是很是强大的。有人认为开放式的发现可能是通向人工智能的最快路径,这样机械险些具备人类所有的能力。人工智能领域的大部门研究都集中在人工设计智能机械的所有构件上,好比差别类型的神经网络架构和学习历程。

但现在还不清楚这些信息如何最终整合成一种通用智能。相反,也有人认为应该更多地关注设计AI的AI。算法将设计或进化神经网络和它们学习的情况,使用诗人的方法。

这种开放式的探索可能会通过我们从未预推测的途径,或者通过种种各样的外星智能,引导我们获得人类级此外智能。这些外星智能可以教给我们许多关于智能的知识。有一件事真的很惊人,可能也很疯狂,那就是我是如何来到这个世界上的,基本上和让我来到这里的算法洞察力是一样的。

导致我们顿悟的工具其实是由顿悟自己来解释的。


本文关键词:神奇,神经网络,让,盘算机,自我,进化,探索,leyu乐鱼全站app

本文来源:leyu乐鱼全站app-www.fuyangyy.com

电话
0603-923786965