我们都知道在人工智能领域,谷歌绝对是当中的佼佼者。前几年阿尔法狗大战李世石,然后是前一阵子的阿尔法狗二代大战柯洁,都以胜利告终。 现在,这家公司又让它的AI具备了一项更富人性化的技能——打个盹,小憩一会。 谷歌发的文章指出,按照常理,人们确实不会想到让人工智能“睡觉”,毕竟在很多人眼里,要人工智能过来就是为了让它们在人类休息之后继续完成工作。但这实际上是deep-Q network的关键部分。 这套算法只需输入原始像素和得分就能掌握大量Atari 2600游戏且达到超人水平。DQN能够通过储存能“离线”回顾的训练数据子集模拟经验回放,这使得它能从过去的成功或失败中展开学习。 无论是神经网络、AI还是机器学习算法,研究人员要做的就是让它们具备自行解决问题的能力。 像之前百度搞出来的自动驾驶汽车就需要对交通状况进行决策、数据分析算法需要决定如何分组信息,而AI需要的就是要像人一样的思维方式。 谷歌最新提出的方法意味着即便计算机正在使用其所有功能资源解决问题的时候,它也能够在稍后休(li)息(xian)之后利用保存的信息“做梦”,然后再在重新上线之后将问题解决掉。也就是说,未来,当你的电脑进入睡眠模式之后,实际上它很有可能正在为下一次的任务开始做准备了。 当然谷歌的野心不止这些,他们早已将《星际争霸2》作为人工智能实验的下一个目标。记得全段时间星际选手的采访吗?职业选手对于AI玩星际这件事表达了积极态度。 但到目前为止,对于该公司的算法来说,这被证明是一个艰难的领域。 该公司在周三的一篇博客文章中说,DeepMind现有的算法,包括那些在经典的Atari游戏中使用超人类技能的算法,“无法赢得一场针对最容易内置人工智能的单一游戏”,更不用说挑战熟练的人类了。 该公司表示,其软件代理商将需要在机器学习方面取得新的突破。这篇博客文章并没有透露DeepMind可能会有多大的突破。 《星际争霸2》是由暴雪娱乐在2010年7月27日推出的一款即时战略游戏。由于游戏极其考验玩家对资源的运营策略,因此也被视为AI研究的突破点之一。 早在2016年11月份,DeepMind公司就宣布与暴雪娱乐合作,将针对《星际争霸2》展开一系列的研究实验。 暴雪娱乐承诺将持续发布从《星际2》天梯中收集的数十万个匿名录像,帮助DeepMind训练,也让研究变得相对简单。但这并不意味着挑战星际争霸是一项轻松的任务,视频游戏的复杂性和更多可能性,决定了人工智能战胜人类远比在棋盘游戏上困难。 不同于围棋的轮流依次进行对弈,并拥有决策时间,在星际争霸中,玩家会同时出招,且不能看到对方玩家的状态,也就是说,所有决定需要在“不完整信息”的情况下做出。这就意味着,玩家不仅得靠逻辑和一些步骤找到赢得对决的最优方式,还需要策略和直觉。 然而目前,人工智能对《星际争霸》的探索还处在非常早期的阶段,不仅需要训练各种常识,而且在面临突发情况时的应变能力也有所不足。 简单电脑都打不过,别说你会玩星际
|