400-893-5552

AlphaGo下个月卷土重来,这一次的对手是柯洁

 
2017-04-11 13:44:46所属分类:行业动态

昨天(4月10日),谷歌在中国棋院召开发布会,宣布5月23日-27日在乌镇主办“中国乌镇·围棋峰会”,届时AlphaGo将再度与柯洁等为代表的中国顶尖棋手进行围棋对弈。

\

除了备受瞩目的AlphaGo与世界排名第一的柯洁的三番棋对弈之外,本次峰会还将举办配对赛和团队赛,配对赛中,两位棋手将分别与AlphaGo组队,挑战棋手如何理解AlphaGo独特风格并与之合作;在团体赛中,将由五位中国顶尖棋手合作,建立棋手“神经网络”,降低心里因素的影响,从而做出更加客观的判断。

距离去年AlphaGo 战胜李世石,已经过去了1年多的时间。在五局三胜制的比赛中, AlphaGo连胜三局提前2轮赢得了比赛 ,虽然李世石最终赢得了一局比赛,挽回了颜面,但是AlphaGo展现出了无懈可击的强大,让人印象深刻。

然而,当时对弈的只是AlphaGo的1.0版本,本次与职业围棋九段选手柯洁对战的是AlphaGo的2.0版本,它采用了新的算法模型。

而在去年12月29日开始,它还曾经化名Master在围棋网站上轮番挑战中日韩围棋棋手,其中包括了聂卫平、朴廷桓、井山裕太等知名高手,并在1月3日晚间赢了柯洁, 最终以60场不败的战绩结束了非正式的测试 。

AlphaGo是谷歌DeepMind团队开发的一款围棋人工智能程序。据DeepMind介绍,1.0版本的AlphaGo是“深度学习”人类棋谱得出围棋手数的估值,AlphaGo1.0所走招法其实并没有脱离人类的理解,而且也是人类棋手曾下过的棋。如果AlphaGo1.0完善到极致,就意味着得出了接近完美的围棋手数估值函数。

2.0版本AlphaGo利用这个估值函数自我对局和“深度学习”,不再受人类棋谱的局限,下出真正属于“人工智能”的围棋。

AlphaGo主本身主要由以下部分组成:

走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋;

快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋网络快1000倍;

估值网络(Value Network),给定当前局面,估计是白胜还是黑胜;

蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这三个部分连起来,形成一个完整的系统。

根据AlphaGo研究者DavidSilver的解释,AlphaGo的策略是围棋巨大无比的搜索空间压缩到可控的范围之内。

在AlphaGo两种不同的神经网络中,“策略网络”的作用是预测下一步,并用来将搜索范围缩小至最有可能硬起的那些步骤;“价值网络”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。

在之前,腾讯AI Lab团队也推出了自己的围棋人工智能“绝艺”,不但赢得了世界围棋AI冠军,也在后续的比赛中战胜了人类棋手。而根据绝艺团队的介绍,绝艺的算法也是基于AlphaGo的策略网络和价值网络两大核心。

而且,会下围棋的AlphaGo也只是DeepMind研究的人工智能项目之一。作为谷歌的顶尖技术团队,其更大的目标是在智能助手、医疗和机器人这样的领域取得进展,另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。

Copyright © 2013-2018 合肥彼岸互联信息技术有限公司 All Rights Reserved地址:合肥市高新区亚夏汽车大厦17楼
工信部备案号: 皖B2-20150071-4    增值电信业务经营许可证:皖B2-20150071-4 安全联盟认证 安全联盟认证 安全联盟实名认证

copyright@2015 合肥彼岸互联信息技术有限公司

电话:400-893-5552 0551-65371998 QQ:800022936

地址:合肥市高新区亚夏汽车大厦17楼