去年3月一战成名的AlphaGo(阿尔法围棋),在岁末年初化身为“Master”,进行60场互联网棋局车轮大战,挑落了几乎所有的中日韩三国围棋界泰斗名宿与天才新秀。
随后在当地时间1月4日清晨,谷歌DeepMind创始人兼CEO戴米斯·哈萨比斯(DemisHassabis)发布推文称,Master就是AlphaGo,正式宣布升级版的AlphaGo问世。
剧情像极了电影《终结者》中,阿诺·施瓦辛格狠狠地甩来的一句“I will be back!”
AlphaGo曾向多位高手下“战书”。韩国棋院的负责人向透露:“此前,Master背后团队DeepMind曾表示,最后十局,想和曾经称雄一时的各国围棋界高手进行对决。应该是在这种情况下,‘棋圣’聂卫平九段和常昊九段等和Master进行了对决。”
而DeepMind也希望韩国的曹薰铉九段和李昌镐九段两位“围棋泰斗”应战。不过,曹薰铉九段已成为韩国执政党新国家党的国会议员,因党内事态混乱,未接受邀请。
而韩国围棋界的另一位泰斗李昌镐九段拒绝的理由更为“直白”。他表示,自己并不喜欢下互联网围棋,拒绝了对决请求。
“如果只论胜负的话,毕竟人工智能没有疲劳,也没有任何失误;这种不同于人类的绝对优势,以及可以按照某种特定的规则进行不断训练的条件,都为它创造了良好的条件,人工智能获得胜利,不见得是个意外。”韩国女棋手尹英敏(音译)四段说。
发展速度令人震惊
就在去年3月,AlphaGo曾经在韩国打败了当时韩国专业围棋手李世石,震惊世界;彼时尹英敏曾经确信李世石会获得胜利,甚至表示“如果李世石真的输掉,那么我们这些围棋指导者,可能就都会面临失业了”。
尹英敏在韩国首尔运营一家围棋培训机构。时隔近一年,记者再访尹英敏,她正在接待来带孩子学习围棋的家长。
“事实上,世纪级人机大战过去一年,不仅没有使我失业,反而还使许多民众的关注点放在了围棋上,更多家长开始关注围棋对于儿童智力发展的促进;这可能也是人机大战给围棋界带来的好处吧。”尹英敏说。
而韩国棋院的负责人也证实说,“在去年人机大战以后,咨询观看围棋比赛,以及申请参加围棋段位赛的人数也有了明显增多”。
对于Master的频传捷报,尹英敏似乎也看开了很多。“看到许许多多中日韩的顶级棋手都纷纷败给AlphaGO,看着这些自己的偶像一个个失败,心中还是有一些吃惊和失落的。”她坦言。
对于Master的棋风和水平,尹英敏承认“要远高于此前人机对战时的AlphaGO,棋风稳健并极少失误”,并表示“AlphaGo人工智能的发展速度着实令人吃惊”。
哈萨比斯说,他的团队一直在致力于提升AlphaGo的性能,过去几天他们用新版测试了几次非官方的围棋游戏,这要感谢网名为Magister和Master的账号,两者分别在Tygem(弈城围棋网)和FoxGo(野狐)的服务器上运行;也要感谢所有观看比赛的人。他们对比赛结果非常满意。“更重要的是,新的AlphaGo在游戏过程中为围棋界提供了宝贵的经验。”
哈萨比斯还特地提到了在对弈中失败的古力,“古力发表博文称,人类和人工智能一起将会很快发现深度学习的奥秘。”
“我们期待官方的测试,并将于今年再次举办整场的围棋比赛,挖掘AlphaGo博弈过程中所呈现出来的创造力。”哈萨比斯说。
围棋还能这么下?
2016年12月29日,Master首次出现在弈城,并在当晚就很快取得了对国内高水平职业棋手的十连胜;30日中午,它又在数次连胜后,拿下了“韩国第一人”朴廷桓九段和疑似“中国第一人”柯洁。
柯洁此前在观战时曾惊叹:“从来没见过这样的招法,围棋还能这么下?”“人类数千年的实战演练进化,计算机却告诉我们人类全都是错的。我觉得,甚至没有一个人沾到围棋真理的边。”
1月4日晚,在连续对阵申真谞九段、周睿羊九段、古力九段后,AlphaGo的连胜纪录扩大到了60场,按照事先的计划,围棋程序的非正式比赛测试暂时告一段落。
网络快棋是目前职业选手练习的主要方式之一,因为每一步思考时间很短,与带奖金的正式比赛相比,快棋赛中对决双方更加容易出错,所以这次升级版AlphaGo的实际围棋水平如何还需要正式规则比赛的进一步检验。
Master展示了人类棋手无法企及的快棋水平,但如果给人类足够的思考时间,是否结果会不同?
冲击已经开始
值得一提的是,去年12月13日,多名谷歌高层曾经突访中国,他们在中国棋院与聂卫平、柯洁等人进行了交流,并达成了合作协议。随后在日本棋院JournalistClub的颁奖仪式上,哈萨比斯曾表示:“2017年对AlphaGo和围棋界都将是充满兴奋的一年。”人们没有意识到,在新的一年还未到来时,人工智能对这项流传千年的古老技艺的冲击已经开始。
芝麻科技创始人、CEO朱智对记者表示:“这次比赛相比上次和李世石的三局体现出了AlphaGo更好的稳定性和信心。在围棋这个领域,人工智能证明了它确实表现得更好,但这并不意味着机器具有智慧。事实上,机器更擅长处理这些复杂的理性问题,因此在许多的特定领域,机器学习所带来的智能将逐渐改变传统的模式。”
而Master版本相较AlphaGO是否有升级与改进,又究竟是优化了什么使其变得如此强大,具体的改进方案目前仍没有公开。人工智能公司第四范式创始人兼CEO戴文渊猜测认为,“经过逾半年的训练,数据量应该提升了不少,上回训练了800万盘棋,这次估计好几亿了。另外针对上回(对李世石)第四盘棋的弱点,估计在训练方法上也有改进。”
知乎上同样引发了Master是否升级的讨论,一位备注为“未来知识图谱创始人”的用户表示,变强的原因在于,“Master是在AlphaGo的基础上调整了算法和参数的,而不是它下过多少盘棋,毕竟机器不会真的‘学习’,它只是在重复使用人设定的算法,为优化参数提供数据。”
不过戴文渊认为,升级版的AlphaGo“在对弈中可能会有一些随机或者非随机的扰动,即选择不是最优的位置落子,尝试新的可能,不会是很笨地自己和自己下”。
电气和电子工程师协会(IEEE)高级会员、英国厄尔斯特大学计算机科学专业教授柯伦(KevinCurran)对记者表示:“AlphaGo的成功就连它的创造者们也大吃一惊。我们都知道AlphaGo已经非常先进了,但是没想到它竟如此优秀。由此可见,增强学习加上‘树搜索’而成的算法,的确有效增加了‘胜率’,这是AlphaGo优于最厉害的人类围棋选手的地方。同时我们也不应忘记,当初谷歌的DeepMind团队研究人工智能技术的目的,并不仅仅是为了研发一套围棋比赛工具,而是为了在将来能够更好地把人工智能科技应用到医疗、机器人、无人驾驶汽车、农业、金融等为人类服务的行业当中。这才是如今科技发展最让人惊艳的地方。”
诗人艾略特说过,“去年的话属于去年的语言,明年的话等待另一种声音。”这用在人工智能的瞬息巨变上丝毫不差。