您好,欢迎来到白雪棋院官方网站!
白雪棋院
当前位置:主页 > 围棋 > 新闻动态 >
刘知青:围棋人机大战是人工智能技术的展现
时间:2016-03-21 12:41 作者:嘉琪 来源:新浪体育 点击:
北京邮电大学软件学院教授、围棋软件开发者刘知青北京邮电大学软件学院教授、围棋软件开发者刘知青

  道与数

  ——“人机大战对围棋文化的影响”研讨会

  时间:2016年3月16日9:00—13:00

  地 点:北京裕龙国际酒店第八会议室

  主办单位:《光明日报》国学版 国学网

  邱运华(首都师范大学副校长):

  今天我们所谈论的,是一个面向未来的崭新话题。原来国学网也主办过一些活动,比如《中国围棋古谱集成》,是面向过去的整理;“国学杯”是面向业余棋界的比赛,等等。而本次座谈会则是面向未来的一个活动,这是非常有意义的。

  尹小林(首都师范大学电子文献研究所所长):

  这几天我看了大赛的棋谱和一些媒体的报道,有三点感受:

  第一是强者至上。在围棋界,谁的水平高,谁就拥有更多发言权。此前计算机软件水平不高,没有多少发言权。这一次AlphaGo软件出来以后,职业棋手就开始谦虚了。

  现在讨论比较多的,把计算机叫作围棋上帝。从某种意义上讲,计算机就是代表上帝和人在下棋,我的第一个感受就是计算机太强大了。

  第二是大道至简。最大的道理是最简单的。今天我们还请了《周易》方面的专家,《周易》的“易”与对弈的“弈”是同音的,在古汉语里面,同音往往同义。当围棋这么复杂的游戏可以简化到用二进制来表述的时候,它就与《周易》相通了。

  原先我们认为围棋变化太多,无法计算,但是当我们找到一种算法时,情况就变了。前两天一个计算机专业的朋友跟我透露了一个信息,他说现在AlphaGo已经找到一种基于图像的算法,直接计算棋形的面积,计算双方棋子的面积。大道至简,最复杂的东西用最简洁的方法来表示,这就是计算机的基本原理。

  第三是弱势平衡。世界上不能只有强者,弱者和强者是共存共生的。比如王元老师是职业八段,我是业余三段,如果他让到五六个子的时候,我们双方力量就平衡了。实际上我们的文化也好,围棋也好,《周易》也好,中医也好,都在讲平衡。这次人机大战很大程度上是在逼迫我们去思考历史、现代和未来,我们需要从文化的角度去思考这次人机大赛的意义。

  一

  刘知青(北京邮电大学软件学院教授、围棋软件开发者):

  前年我写过一本《现代计算机围棋技术》,我在那本书里做了一个大胆预测,计算机围棋会在五到十五年之内战胜顶尖职业棋手。这个可能是当时最大胆的预测了,没有人相信。去年10月AlphaGo战胜樊麾,但当时没有公布。今年1月28日,他们的文章在顶级科学杂志《Nature》上发表,公布了这个事实。这远远超出我及同行们的一个最乐观的估计:不是五到十五年,而是五到十五个月就已经完成了。

  《Nature》那篇文章非常重要,我仔细读过它。那篇文章指出了一个很明确的方向,但是它没有公布细节。所以别人要复制那些细节还是需要一定的工作量,这就像知道要这样做才能爬到珠穆朗玛峰,但你按着方法去爬,也不是十天半个月就能够做到的。

  这个团队非常强大。《Nature》那篇文章就有二十几位作者,都是长期从事计算机工作的博士专家,最前沿的学者。主要人员都有十多年的计算机围棋研究背景,有十多年的积累。阴谋论总是有的,但我看他们的论文,非常有说服力。而且,世界上能够这样战胜李世石的,应该是没有的。在现场它不可能去作弊,它下棋的方法也不是人的方法,它做了很多交换,我们看来都是俗手,这些小细节不是最优,但它仍然可以碾压李世石。李世石唯一的翻盘,只是计算机在那个时候犯了一个错误,而这个错误其实是它使用技术的一个特征。这个弱点恰恰说明这是一个软件,是一个计算机。而且它的强项也是计算机的强项,不是人的强项。整个比赛过程应该还是一个非常有说服力的技术的展现。

  孙茂松(清华大学计算机系教授):

  五六年前,微软有一个华人学者,负责微软的语音识别项目,他与我商量说能不能做个围棋软件。当时我觉得围棋太复杂了,这也是业界的共识。我大概算了算,纵横19道,361点,每个点都有白子、黑子、无子三种可能,这就是3361。算下来一盘棋有10172种可能。

  林建超(中国围棋协会副主席):

  这是沈括在一千多年前记载在《梦溪笔谈》里的,其实理论上还要比这个数字大得多。沈括当年不能掌握的,一个是组合的方法,第二个是满空间的算法,第三个是黑白双方运行,而且他不知道重复提子,这些东西当年都没有计算在内。所以一个点不是三种可能,而是无限种可能。

  孙茂松:

  反正很复杂。而且你还得把人类下得比较好的棋谱给它输送进去,大学没有这个工程能力,国内科研体制下也没有办法拿到这个经费。但是当最近两三年卷积神经网络出来的时候,我的第一直觉就是:围棋可以做了。因为卷积神经网络这几年在语音识别、图像识别上的进展突飞猛进。语音识别现在的错误率大概在9%,而以前要高得多。这是现在包括谷歌、微软、百度在激烈竞争的一个领域。这个卷积神经网络,即便是输入一张最简单的图片,64×64的一个点阵,也比围棋要复杂得多。

  韩立新(清华大学哲学系教授、清华大学围棋文化交流与研究基金会主席):

  不好意思打断你一下,是不是说在图像识别这个技术上,人工智能已经比人类高?

  孙茂松:

  对。把物品分成一千类,然后给一张照片,给五个答案去选。这个条件下,现在机器做得要比人好。因为这一千类中,有很多东西人可能不认识。比如这个花是什么花,你可能不认识,但机器有大数据的能力,就会做得比较好。卷积神经网络是一个通用模型,拿这个图像数据去训练,它就能把图像识别做好,拿语音的去实验,就能把语音识别做好,用围棋数据去训练,就能把围棋做好。它根据整个盘面去计算,所以可以掌握所谓的“大势”。但这个大的局面,它自己其实并不知道,它就是靠算法,变成一个函数。网络本身可能很复杂,但整个结构非常简单。输出是什么呢?输出就是下一步棋,你落在某个格子里的概率。刚开始所有的参数都是随机给,但当前这个盘面,黑白这个是定式,这个是有的,所有的参数往上算,算到最后那个输出端,然后它去算落在每一个格上的概率。刚开始它不准,需要靠数据去重新反向训练神经网络,最后只要给个棋盘,我保证落在人类专家放的那个位置的概率是最大的。

  毕达哥拉斯说:“数字是宇宙的统治者。”围棋几乎没有规则,全是靠计算,最终结果全是一组一组的数。所以AlphaGo输棋不是BUG,是其模型本身的性质,可能出昏招,也可能出奇招。搜索空间这么大,人类棋手实际上形成了一种人类高级智慧所确定的搜索范围,搜索空间大大缩小。而AlphaGo则是全空间搜索,有可能出一些人类无法想象的、匪夷所思的奇招,有可能触碰到人类惯性思维的盲区,对我们下棋会有所启发。

  这个模型除了围棋,还可以做很多事。比如我的学生运用类似模型研发程序,训练计算机作古诗。试举一例,上句古人诗云“江上西风一棹归”,下句计算机续曰“夕阳不见客舟低”。再举一例,上句古人诗云“又听西风堕叶声”,下句计算机续曰“万事尽随天籁起”,又续云“天涯游子不胜情,江山满眼愁多少,剩有心事绪未成”,意境、平仄、韵律都还不错。

  (来源:光明日报)

微信扫一扫,了解更多
在线咨询:
白雪棋院官网服务器升级通知
亲爱的用户您好,白雪棋院将于最近升级官网服务器,在此期间网站无法打开,敬请谅解!谢谢