您好,欢迎来到白雪棋院官方网站!
白雪棋院
当前位置:主页 > 围棋 > 新闻动态 >
褚达晨:AlphaGo剑气合一 李世石真的很了不起
时间:2016-03-12 11:16 作者:嘉琪 来源: 新浪体育 点击:
汪星人汪星人

  昨天发了“AlphaGo之吴清源重生”后,得到很多亲友鼓励。今天趁热再说说AlphaGo是如何炼成“剑气合一”的武林绝学的。我本人非CS出身,道听途说二把刀水平,方家见笑了。

  围棋软件已有二十多年历史,大致分为三代。第一代以陈志行老师的手谈软件为代表,单机X86 DOS环境,大致是教电脑背得定式手筋死活几万个,依葫芦画瓢。所谓熟读唐诗三百首,不会作诗也为吟,假设遇见真把式,三拳两脚败下阵。。。厉害的能达到业余初段水平,此处略去三百字。。。

  21世纪开始,计算机的单机性能,分布式计算等能力大发展,围棋软件也升级进入第二代:蒙特卡罗派横空出世。大家熟知的打败卡斯帕罗夫的“深蓝”就是蒙派高手。和第一代比,蒙派就是会算棋了,它能用计算机的蛮力,算出所有变化,得到最优解。国际象棋棋盘小,电脑暴力计算得逞就能下赢人了。打个金庸小说的比方,蒙派高手像是剑宗,剑舞的比人快,如果比武规定的招式有限,人就打不过了。这一代的围棋软件以Zen,SupoerGo为代表,能达到业余5段水平(就是和我能斗成一团,有的一拼了J)。这么样的业5呢?他们对比“手谈”大局观好了很多,但围棋比国象招式复杂太多,蒙派高手的蛮力不足以找到真正的全局最优解,但是大方向比“抄作业的”第一代软件强了很多,如果遇到真正的人类职业高手,它傻乎乎的狂舞一阵剑,高手跑到你背后点个穴道,扑通一身,Zen啊,SuperGo啊,就倒了。

  好了,第三代猪脚,AlphaGo来了,就是这一两年的事。背景是Google,Facebook这样的科技公司所掌握的计算机技术和能力,已经不是上一代IBM可以比的了(商业教科书里说郭士纳帮助IBM成功转型为服务公司,可另起一篇随笔讲,这里就呵呵了)。5年前开始大肆流行的互联网黑科技是从机器学习到深度学习,放在围棋软件上,就是可以开始练“气宗”的武功。什么叫气宗?就是用神经网略深度学习的武功,从任何棋局里,让计算机自己找到接近人类水准的N个下一手候选点,不用再无谓的漫天狂算而郁郁无果。Google旗下Deepmind的AlphaGo和FB田博士领导的Dark Forest就是这样两支科技奇兵。

  听起来有点神奇,我拿我知道的互联网广告知识简单说说什么是机器学习和深度学习的区别。我在上一家公司时正逢厂长大搞互联网广告技术,从谷哥转会来的栋哥和兄弟们一起搞广告机器学习,让机器把千千万万的网页和万万千千的广告客户之间最佳对应关系,在一毫秒之内,搞定!机器面对天文级的各种数据特征,开始也很辛苦,这时代表人类的广告老师傅PM同学们(或者广告策略RD同学们),指个方向,机器如能快速验证这个方向是正确的,就OK了。如果要机器自己找方向,那也挺费劲。。所以一时洛阳纸贵,做广告策略的同学们忽然变得很值钱。。后来到了凯哥加盟度厂的时候,就是发展深度学习技术了(大名鼎鼎的DL研究所)。第一次听凯哥讲什么叫深度学习,什么叫N层网格,我也惊了:机器不再需要老师傅指路,它居然自己能发现人类老师傅的那个“金手指”,搞定最佳值!话说凯哥现在已经自立门户,和我居然选在同一个屌丝楼里办公创业,想想他手中的黑科技,要流口水啊。

  饶了一大圈,alphaGo在台湾业余围棋高手+计算机大拿黄博士(就是坐在李世石对面替狗摆棋的Aja Huang)等一群黑科技大牛的养育下,在“剑宗武功“(蒙特卡罗)的基础上,开始练“气宗武功”(深度学习),在漫天剑舞中,狗狗不忘凝神看大局,找到接近人类老师傅的几个最佳点,然后用剑宗武功一路猛算,落子。到了一定水平后,自己和自己下棋,也能不断涨棋了。剑气合一的武功难不难练?很难练,只有几个黑科技大本营能练出来,这里不展开说了。。。

  所以小李同学,你知不知道,你真的很了不起!AlphaGo已经剑气合一,每分每秒在自顾自的练神功。对它而言,没有棋型,没有感情,只有死活和胜负概率。它的棋风看起来像李昌镐,是因为李昌镐就是在人类剑宗大师曹薰铉的指导下(压力下)被迫练了“剑气合一”的武功,和狗狗有点殊途同归。

  所以飞禽岛少年,忘掉你现在的功名和人类尊严的包袱,回到少年时,想想初到汉城,第一次面对石佛,拔刃刺佛的勇气和专注。说不定Alpha现在剑气合一也只练到第五重,你有少年郭靖之福,一匕刺入陈玄风的肚脐眼,为你后三盘祝福!

  业余创作,感谢阅读!

(褚达晨 达晨随笔)