DeepMind最早成功做出包括教授AI玩古老的视频游戏,如《Breakout》和《Asteroids》。但这里所指的游戏最终是让机器人做梦,做和人类做相同的事情,让机器人在现实的学习和信息存储过程中发挥重要作用。
为了理解实现让机器人做梦的重要性,先要理解做梦对哺乳动物(例如我们自己的)大脑是帮助的。科学家试着从神经科学的角度理解做梦的作用时,发现做梦的大部分内容都是消极或有威胁感的,可以尝试做一个月的做梦日记,你会发现这是真的。
事实证明,当人类梦到尴尬的事情或有威胁出现时,AI梦到的却还是重新排列游戏的各个章节,过程往复,但引导机器人做梦实质是让AI像人类那样可以通过实验不断学习。利用AI技术引导机器人做实验并分析不同的行为过程,以及对结果产生的影响。
通过AI“做梦”的方法快照
那么机器人可能面临的挑战是什么?目前,世界上最先进的AI也只停留在主攻复杂的视频游戏,如星际争霸II和迷宫。通过“做梦”,AI能突出游戏某些特别有挑战性的部分,循环往复直到获得专业知识,而不是毫无意义地排练游戏的整个过程却对玩家的分数没有丝毫影响。使用这种技术,DeepMind研究人员能够实现以10倍的速度加快的学习效率。随着AI技术的提升,这个速度可能会更快。
你可能还会问,为什么AI“做梦”很有必要。因为机器人已经在大多数游戏中(如国际象棋和围棋游戏)掌控人类行为。要掌握这一点,有必要区分使用监督学习(通过AI分析数据并寻找相应模式)与无监督学习的方法。迄今为止,通过AI实现且令人印象深刻的技术,大部分是使用监督学习法来实现的,由程序员提供“训练数据”,AI学习检测数据模式。这是一个相当简单的训练机器人的方法,但决不是人类学习的方法。而是使用一种更类似于程序员所说的无监督学习法,这种类型的学习比监督学习要花费更多的时间,因为它涉及实验等一系列变量的存在。