新AlphaGo:砍断“人类束缚”
作为一个从2014 年发展至今的围棋人工智能项目,其实AlphaGo 在发展历程中使用过多个名字,比如最早期亦城围棋上的“DeepMind”,又或者是之前在野狐平台上的“Master”。那么这次的“新AlphaGo” 是否也只是一个新名字?
答案必然是否定的,之前起新名字很可能有保密、个人喜好等原因,但这次新添加的“新” 字只为了突出一点——这是“机器自学” 为主的一版AlphaGo。
这一点判断的线索,来自于今年初,Master 在网络上一口气横扫60名人类棋手的时候。
这种表现,与将近一年前的“老AlphaGo” 可谓天差地别。想要达成这样的成绩只有一种可能——DeepMind 寻找到了一种机制来摆脱围棋中的“人类束缚”。
迷之改进:一举让AlphaGo 成为人类老师
作为一个极其特殊的棋类和任务,围棋拥有数量极其庞大的可能性,总的局面数量达到10^172,而可观测宇宙范围内的原子数量不过10^80。这也意味着穷举绝对不是一条明智的路线。
最终DeepMind 给出了一套能够“模拟” 出人类顶尖高手的方案:深度学习+ 蒙特卡洛搜索树+ 自我进化。
如果你对其中的细节感兴趣,推荐阅读国内人工智能创业公司彩云AI 创始人、CEO 袁行远在知乎上的相应回答。
深度学习用以分析人类棋盘,蒙特卡洛搜索树用来减轻工作量,自我进化用来提升能力。但有限的运算能力还是给DeepMind 出了一个不小的难题,后者最终想出了一个办法:只对学习到的人类棋招进行蒙特卡洛搜索树运算,这恰如人类棋手依赖定式。
定式,又名定石,指的是人类下围棋长久积累下来的一种经验,对弈双方在特定情况下会遵循固定下法。著名棋手吴清源则将简单描述为“在角部彼我棋子接触时最合理的走法”。
这些定式被记载在各式各样的棋谱当中,成为新手入门必看的书籍。
虽然定式是某种意义上是最合理的走法,但它却是理想化条件下的产物,想要完整复现定式,意味着双方都必须抱有同样的理想化思路。而历史上并不缺乏不遵守定式,或者用新定式打败对方的事例。
问题来了,为什么千变万化的围棋会出现定式?而且死守定式会输,不学习定式也会输。答案只有一个——人类需要定式来减少围棋上面的变化,这样进入中盘之后人类才能利用自身能力掌握棋局走向。
凑巧的是,这回我们遇到的是运算能力远超人类的计算机,让掌握更多乃至全部围棋奥秘拥有了一丝可能。
但究竟新AlphaGo 怎么样摆脱“人类束缚”?参考之前“老AlphaGo” 的工作方式,排除运算过程中所有人类元素可能是最彻底的方法。但这样一来就必须找到另外一种减轻运算压力的策略。目前来看,这个秘密也只能等DeepMind 方面稍后公开了。
人类败局已定?
尽管去年人类代表是韩国选手,但明眼人都可以看出当下和去年围棋人机比赛的热度差别。这从另外一个侧面也反映出了绝大部分观众的看法:这次人类要输。
柯洁个人资料
柯洁,中国围棋职业九段棋手,浙江丽水人。曾获2007年全国少儿围棋锦标赛冠军,2008年世界青少年围棋少年组冠军,第28届应氏杯世青赛围棋青年组冠军,2014年10月第16届“阿含桐山杯”中国围棋快棋公开赛冠军,
2015年3月第16届“阿含桐山杯”中日围棋对抗赛优胜,2015年4月第15届“理光杯”中国职业围棋赛冠军,2015年8月第一届“洛阳白云山杯”围棋世界冠军邀请赛冠军,2015年11月第11届“威孚房开杯”中国围棋棋王争霸赛冠军 。
2016年2月CCTV贺岁杯围棋争霸赛冠军。2016年8月第二届“洛阳白云山杯”围棋世界冠军邀请赛亚军。2016年9月第18届“阿含桐山杯”中国围棋快棋公开赛冠军 。围棋等级分排名世界第一。
自2015年1月至2016年1月,在一年内夺得第2届百灵杯世界围棋公开赛冠军、第20届三星杯世界围棋公开赛冠军、第2届梦百合杯世界围棋公开赛冠军,成为世界上最年轻的围棋三冠王。
2016年3月,作为主帅的柯洁为中国队夺得第17届农心杯世界围棋团体锦标赛冠军。2016年7月和於之莹搭档夺得世界围棋混双赛冠军。
2016年12月蝉联三星杯世界围棋公开赛冠军,收获个人世界大赛第四冠的同时也成为中国首位蝉联同一项世界大赛冠军的围棋选手。
12月15日,获得2016CCTV体坛风云人物年度最佳非奥项目运动员奖提名奖。
相关文章推荐:
相关文章