5月23日下午近3点,经过4小时17分37秒的鏖战,围绕在柯洁和AlphaGo的第一场人机大战的结果最终定格在“AlphaGo执白1/4子胜”。19岁的柯洁一边数子,一边露出苦笑。
“输得没什么脾气。”柯洁在赛后新闻发布会上说。
对一个职业棋手来说,争胜是他的宿命。但柯洁不得不承认,AI进步速度太快了,AlphaGo和去年相比判若两人,“当时觉得它的棋很接近人,现在感觉越来越像围棋上帝。”
“我输得没有脾气”
与AlphaGo对决前夜,柯洁感慨万千。
“现在的AI进步之快远超我们的想象。”柯洁说,自己相信未来是属于人工智能的,可它始终都是冷冰冰的机器,与人类相比,感觉不到它对围棋的热情和热爱。“对它而言……它的热情——也只不过是运转速度过快导致CPU发热罢了。”
他说,要用自己的所有的热情去与AlphaGo做最后的对决,“即使面对再强大的对手——我也绝不会后退!”
这次的人机对战采用“慢棋”赛制,这对于人类棋手有一定利好。但距离今年年初AlphaGo的化身Master以60战不败成绩完胜世界顶尖棋手已经过去4个多月的时间,柯洁面对的是又一次进化了的人工智能。
相比较并无太多悬念的比赛结果,人机对弈的过程不失精彩。
比赛中柯洁执黑先行,在比赛前半段中,柯洁表现相对轻松,还曾露出微笑,引发了现场人士的不少猜测。但在比赛接近尾声时,他的表情渐渐冷峻起来,时而托腮,时而眉头紧皱,并且频繁地抓着头发。
中国围棋协会秘书长华以刚在解说中透露,抓头发是柯洁下棋时的小癖好,但这一次,形势似乎不太乐观。
相比之下,AlphaGo落子速度飞快,有些棋子甚至是“秒下”。
AlphaGo早已展现出超越人类棋手固有思维和套路的招法,为了应对它,柯洁还专门想了一些有针对性的招数。例如在开始时下了两个“三三点角”,这其实是AlphaGo特别喜欢下的招式,柯洁模仿了它的下法,想看看对方怎么应对,结果发现AlphaGo不仅应对得很好,而且不少新的下法都在意料之外。
再如,AlphaGo在中间断过一次,这让柯洁很震惊,在人类的比赛中这样白棋就变成了后手,但柯洁事后分析认为这是一手好棋,其实一石二鸟,做厚了白棋角部的势。AlphaGo这一大胆出击,令柯洁感慨“AlphaGo实在下得太出色了,我输得也没什么脾气,真的是很厉害”。
在讲解中,常昊九段评价,AlphaGo十分注重全局和中央的势力发展,每一手都追求效率,樊麾二段也说,AlphaGo力争在棋盘上的每一个子都能综合利用起来。
至于接下来的比赛,柯洁表示:“我希望我尽全力去拼每一盘,也希望自己给大家带来围棋的快乐。”柯洁透露,这三场比赛将是他与人工智能的最后3盘棋。“希望不留遗憾,下出好棋,让AlphaGo主机更发烫一点也好。”
AlphaGo的下一步
在围棋领域,人工智能战胜人类似乎已经没有太多的悬念。但其实,胜负或许早已不再重要。
在此前接受第一财经记者采访时,古力九段曾说,对于这场人机大战,人类胜率比10%低一些,“我不知道这样说是低调还是高调”。
他认为,AlphaGo有弱点,只是棋手们目前还没有触碰到它的弱点,或者说还没触发出来。“随着局数越来越多,有可能发现它的弱点。”
Deepmind创始人DemisHassabis也在当日说,期待柯洁这样的顶尖棋手能找到此前不知道的弱点,帮助AlphaGo进步。
在现场观看比赛的英语流利说首席科学家林晖博士对第一财经记者说,这个结果并不意外。
“从技术上看,AlphaGo胜在‘没套路’,它严格意义上来说并不是人类教出来的最好学生,不会被人类的下法所束缚。AlphaGo2.0已经超越棋谱,自我督学。AI与AI之间可以相互较量,甚至不眠不休、每时每刻地‘左右互搏’。因而在布局和下法上自成一体,超越人类。”林晖说。
在DemisHassabis看来,AlphaGo不是以编程的系统,而是以增强学习的方式,以人类棋手的经验为基础,进行不断学习形成自我的能力。“就好像哈勃望远镜一样,我们和它一起探索宇宙。”他同时评价,柯洁是一个天才选手,相信他会以一个全新的方式与AlphaGo对弈,为围棋界探索新的方法。
值得一提的是,此次跟柯洁对战的AlphaGo版本是单机版。至于AlphaGo是否能够做到控制胜负差距,DemisHassabis称它的目的是要将获胜概率最大化需要做决策来实现完胜。
事实上,站在人工智能发展如火如荼的今天,这场围棋对决的终极要义是:人工智能为探索围棋的奥秘将带来什么?它的极限在哪里?它将怎样更好地造福人类?
创新工场创始人李开复更直言:“我们应该更加关注商业领域的人工智能,在金融、医疗、教育等领域产生商业价值,让世界变得更美好。”
而在今年IT领袖峰会上,马云更称“AI下棋”并不是人工智能应该体现的能力。“机器要做的是人类做不到的事情,这才叫本事”。
其实,现在已经很难说AlphaGo只是一个面向围棋这一垂直领域的人工智能了。
DemisHassabis表示,DeepMind正在使用AlphaGo系统的变体来服务其他行业,例如通过与人类专家的合作,可以找到各种各样的创新方式,包括从“其中一种变体应用于医疗行业,我们正在着力解决蛋白质折叠的问题,用来治疗各种疾病”。