据外媒报道,由Google子公司DeepMind子公司研发的围棋人工智能程序AlphaGo(阿尔法狗)获得了巨大的更新,使其变得比以往任何时候都更加智能,而且可能更为复杂。在《自然》发表的一篇文章中,该公司透露最新版本的AI——AlphaGo Zero,不需要进行人力培训,以使自己更好,甚至可以打败自己的过去版本。
该公司表示,AlphaGo Zero的研发与其前身有很大不同。研究团队不是根据已知的人类发展战略使AI智能化,而是经过短暂的训练使软件能够轻松击败此前的版本。 AlphaGo Zero能不断更新自己的游戏知识,越来越好。
经过三天的不间断比赛,Zero能够击败去年已经战胜人类围棋世界冠军的AlphaGo版本。事实上,AlphaGo Zero连续赢得了100场比赛,取得全胜战绩。
AlphaGo Zero的主要研发程序员David Silver在新闻发布会上解释说:“通过不使用人类数据 - 通过不以任何方式使用人力知识,我们实际上已经消除了人类知识的限制。因此,它能够从第一原则创造知识。”
简而言之,通过不试图模仿最好的人类围棋选手,AlphaGo Zero实际上消除了任何偏见或疏忽,从而创造出更为纯粹的策略。