西西河

主题:人工智能挑战围棋即将成功 -- 陈经

共:💬76 🌺333 新:
全看树展主题 · 分页
/ 6
下页 末页
家园 人工智能挑战围棋即将成功

(本文首发观察者网)

2016年1月28日一早,围棋圈和人工智能圈被一个消息给炸了:

谷歌人工智能分先5:0击败欧洲职业围棋冠军樊麾,2016年3月将分先挑战李世石,奖金100万美元。

Nature网站出了新闻:

谷歌的人工智能算法精通了古老的游戏围棋(Google AI algorithm masters ancient game of Go)

点看全图

外链图片需谨慎,可能会被源头改

1月28日出版的Nature封面文章介绍了这个人工智能领域的重大突破。

点看全图

外链图片需谨慎,可能会被源头改

文章第一作者David Silver

围棋迷以前的感觉是,电脑围棋确实进步挺大的,但要说能挑战职业棋手,似乎还有很长时间,十年或者更长。

仅仅两个月前,2015年11月,北京举办了一次“美林谷杯”电脑围棋竞赛,冠军是韩国人工智能程序“石子旋风”(DolBaram),被让四子、五子、六子与中国职业高手连笑七段(刚获得名人和倡棋杯两个头衔)对弈。在第一局中,电脑显得无比愚蠢,执着地与连笑打一个注定无法胜利的连环劫,消耗了大量劫材不断亏损,对弈中连笑都笑开花了。直到让六子,电脑才胜了一局。

点看全图

外链图片需谨慎,可能会被源头改

连笑七段和DolBaram作者林宰范

早期的电脑围棋代表程序是我国陈志行教授(量子化学家,跟风云学会会长袁岚峰是同行,2008年去世)开发的“手谈”,上世纪90年代多次获得电脑围棋世界冠军。那时的电脑围棋棋力不到业余一段,业余棋迷们以让多少子战胜“手谈”为谈资,让七八子都很正常。

1997年IBM的国际象棋程序“更深的蓝”战胜了人类最高水平的卡斯帕罗夫,当时兴起了一股人工智能热潮。但是围棋迷很淡定:电脑围棋,还差太远,离一般业余棋手都有不小的差距。按某种估计,围棋的复杂度是10的170次方,比国际象棋的10的47次方多100多个0,电脑还差得远。这个时期的围棋程序有的搜索,有的不搜索,但基本还是与国际象棋的人工智能算法相似,被围棋的复杂度轻易击败,下起来一看就很愚蠢,根本不象人。

和国际象棋类似,中国象棋也被人工智能程序攻破了。业余象棋比赛多次传出选手使用软件作弊的丑闻,职业圈子中王天一、孙勇征等大师也为之争吵。之后围棋逐渐成为人工智能领域的核心难题。Google、Facebook和微软都开了围棋研究小组。

围棋人工智能的上一次显著突破,是2010年左右,开发者们引入了“蒙特卡洛”算法。这种算法的特点是模拟棋局一直到下完算子判断胜负,模拟多次后看哪个选点的“获胜概率”最高。模拟时会利用“棋形”等经验减少选点,一直模拟下去直至终局。时间不够或者电脑计算能力不足,模拟的“局面数”就少,棋力就低。这是一个基于概率的暴力搜索算法,确实取得了突破。代表程序有日本的Zen,法国的CrazyStone,以及前面提到的DolBaram(在北京击败了Zen与CrazyStone)。中国电脑围棋开发者这时落后了,没有开发出水平相当的程序。这些基于蒙特卡洛算法的围棋人工智能,已经可以轻松战胜一般业余棋手了,但是对职业棋手还是差距很大。对局时,电脑招法一般看着还可以,但有时会出现一些莫明其妙的招数,如落后时就开始瞎下。这是因为电脑根据概率评估,瞎下人应错了它有机会胜。

研究者以及棋迷们都认为,蒙特卡洛概率暴力搜索虽然取得了棋力的巨大突破,但不是围棋人工智能技术继续发展的方向。即使再增加算力,增多模拟局面,棋力也不会有本质提升,战胜职业棋手是不可能的。业余棋迷们会惊叹于人工智能围棋的发展,在KGS围棋网上,排着队和Zen等人工智能程序对局很有乐趣。但职业棋手们仍然很淡定,认为围棋人工智能挑战职业选手还是很远的事。

就在前面连笑与DolBaram对弈之后,对于电脑围棋较为了解的中国围棋队总教练俞斌九段评论说:

“国际象棋的电脑程序是围绕着杀死王这一要点设计的,比较有效。而围棋的棋子没有大小之分,电脑无法判断哪条大龙更大,从而无法准确做出取舍。围棋到后盘收官变化无穷,越下到后面,盘面形势就越复杂,这让计算机程序难以做出正确选择。现在设计围棋电脑软件的都是业余棋手,而软件的水平很难超过设计者,光靠电脑会记能算,想战胜职业高手是不容易的。业余棋手思考问题的方法与职业棋手不同,如果今年由围棋和电脑软件高手联手编写软件,那么,电脑围棋的水平会有质的变化。”

点看全图

外链图片需谨慎,可能会被源头改

国家队总教练俞斌九段

这次Google的DeepMind小组开发的AlphaGo取得的突破,可以说打破了俞斌九段的预期。AlphaGo与中国职业二段樊麾分先下成了5:0,新浪围棋有这五局的棋谱。看这五局棋的感觉,AlphaGo下得非常象人,一点看不出是机器下的,和以前的各种程序有显著区别。战绩上也是压倒性的。第一局樊麾和电脑平稳收官,输了3目半。后面四局进行战斗,多次被电脑杀死大龙,全部惨败。

樊麾虽然只是欧洲冠军,但毕竟有中国职业段位,就算多年在低水平环境中棋力下降,业余顶尖水平总是有的。AlphaGo也和之前最高水平的程序Zen、CrazyStone下过,分先495盘只输了1盘。它甚至能让4子对阵Crazy Stone和Zen,胜率分别是77%和86%。这个水平突破绝对是革命性的。

从人工智能技术发展上看,DeepMind使用了“深度学习”技术,而非象俞斌估计的和职业高手合作。电脑通过海量学习人类高手的棋谱,用深度神经网络快速模拟出人的招法,下出来的棋就很象人了。樊麾二段说:“如果没人告诉我,我会想对手下得有一点怪,但肯定是个很强的棋手,一个真正的人”。

点看全图

外链图片需谨慎,可能会被源头改

樊麾二段

Facebook的围棋人工智能程序Darkforest就是用这种办法,不靠搜索,只用深度学习这一招就很快达到了之前研究者多年无法实现的棋力,扎克伯格1月27号正好发文介绍了这个进展。由于棋力还略低于Zen、Crazystone,所以不算是巨大的突破。

而DeepMind小组在搜索技术上取得了更大突破。跟Darkforest相似,AlphaGo用一个深度神经网络(policy network,“策略网络”)减少搜索的选点,象人类高手一样,只考虑少数几个可能的选点。此外,他们还建立了另一个深度神经网络(value network,“值网络”),象人类高手一样,思考到某个局面就有了结论,不必象之前的蒙特卡洛模拟那样下到终局,极大地减小了搜索的深度。

DeepMind引入的另一个逆天的高招是,让围棋人工智能自己和自己下,总结经验,自我不断提高!这个技术2015年2月就在Nature上发表了,标题是《玩游戏的软件从神经科学中吸取经验》(Game-playing software holds lessons for neuroscience)。

这个人工智能自学习的要点是,不需要告诉电脑人类的经验,就让它自己玩这些电脑游戏,只是给出玩的分数。电脑看着分数不断纠正自己的策略,最后就发展出比人类还强的电游技术。这次的AlphaGo也用了这个技术,这又是比其它电脑围棋程序强的地方。从Nature的文章看,DeepMind的绝招是,用50台电脑让AlphaGo不断和自己对弈,下了3000万盘棋!然后每盘棋选取一个局面(不多选,以避免同一盘棋中不同局面之间的相关性),根据这盘棋的最终结果判断局势优劣。这样获得了3000万个训练数据,用于训练生成“值网络”。暴力生成这么多数据需要海量的计算资源和投入,确实只有谷歌这样的大公司敢想敢做。可以看出他们的战略是智能和蛮力两手抓,两手都要硬,哪个合适就用哪个,并且互相帮助。

通过这样三招,DeepMind小组确实在围棋人工智能上取得了巨大突破。而且研究方法的潜力很大,从这个方向上走,最终象“更深的蓝”一样战胜人类最高手是完全可以想象的。一个月前,DeepMind小组就报告说围棋人工智能取得了巨大突破,会战胜人类,但当时棋迷与职业棋手并未留意。现在有了棋谱,又有了技术细节,就显得可信多了。

职业棋手李喆在微博上说:

“Google的围棋AI已具有职业水准。从棋谱初步判断是顶尖棋手让先-让先倒贴的水平,离战胜人类还有一小段距离。但这是三个月前的棋谱...以Google机器学习堆数据的速度,今年三月对决李世石相当值得期待。”

如果象报道的那样,2016年三月AlphaGo真的挑战韩国棋手李世石(过去十年获得世界冠军最多的棋手),这说明Google对AlphaGo非常有信心,认为三个月的时间就能进步到战胜顶尖高手了。DeepMind小组认为,电脑围棋的优势在于一天可以下100万盘棋,而且一直保持水平稳定,而人类能下的棋和能打的棋谱很有限,时间长了还会疲劳出错。

点看全图

外链图片需谨慎,可能会被源头改

围棋世界冠军李世石九段

我认为这次电脑是真的有可能在围棋上战胜人类。樊麾在非正式对局中两次中盘胜AlphaGo,可见AlphaGo也是会认输的,不是永远缠斗到终局,而且樊麾是有击败AlphaGo的棋力的,在正式比赛中可能是太紧张技术变形了。如果李世石象樊麾二段一样心态失衡露出大破绽,肯定会被电脑抓住输掉。即使小心应付,电脑也会有胜机。即使只赢李世石一盘,也是了不起的成就。最终,电脑以稳定的概率战胜职业棋手将在一二年内实现。

这无疑是人工智能领域的巨大突破,预示着机器将在棋类这项“智力运动”上彻底战胜人类。围棋这个人类自以为还能坚固防守五十年以上的堡垒,在引发了人工智能研究领域的巨大兴趣后,被机器出人意料地迅速突破了。

当然正如深度学习技术的发明人、DeepMind小组的Hassabis所言,人工智能真正的挑战是“泛化”的能力。人工智能在围棋上达到的超高能力,并不能转移到其它任务上去。

点看全图

外链图片需谨慎,可能会被源头改

Demis Hassabis,深度学习技术发明人,Google DeepMind 的CEO,AlphaGo的20位作者之一

但是从目前达到的成就来看,人工智能带来的社会革命也许真的快来了。对于人工智能“奇点革命”有兴趣的可以参考:

人工智能革命:通向超级智能之路 人类永生或灭绝

对于我个人,会象许多业余棋迷一样,非常希望Google能把AlphaGo商业化推向市场。这会是围棋学习的一个革命:随时随地有最高等级的选手教你下棋。所以,暂时欢呼吧!

致谢:感谢风云学会会长袁岚峰博士(@中科大胡不归 )的宝贵意见。

通宝推:唵啊吽,红军迷,高中三年,支持中文,西伊,领班军机,盲人摸象,桥上,陈王奋起,曾自洲,
家园 挑个小错

Hassabis不算是深度学习的发明人,是Geffrey Hinton。

知乎上有位田渊栋博士,人从google跳到facebook,也在做这个围棋的项目,在知乎上挺有名的,好像是第一个老中进入facebook人工智能组的,与深度学习领域三大巨头之一的Yann LeCon同组。

这是他在知乎上的个人页面: https://www.zhihu.com/people/tian-yuan-dong

家园 这条消息首先出现在笑话楼里,没想到还是

热乎的消息。

这些东西广告性质的意义大一些,我简单地搜索网络,还以为就是用那个蒙地卡罗算法的AI呢。

AI要战胜职业高手也很简单,以现在的水平,只要下超快棋甚至是快棋就可以了,人脑在速度上是干不过用电的机器的。

其他所谓的自学习AI我觉得不是太靠谱,这是往人脑思维上面靠,机器理解棋局和人不一样,靠多下棋对AI的帮助不会那么大,尽管这是研发团队要我们相信的。

职业高手看那个5:0也和老兄不一样,没有觉得AI就怎么厉害了,这个牵涉到对围棋的理解程度。不过职业高手也可能被机器愚弄,AI如果是遇强则强那就好看了。

出一百万美元挑战人类高手,更像是一场广告宣传战,如果像zen那样不收钱让人来挑战,我看他们很难吸引眼球。当初深蓝战胜卡斯帕罗夫的时候是有人类高手事先调教指点过机器的,这次他们挑战李世石估计也是老李研究的样本比较大。

关键词(Tags): #围棋#AI通宝推:盲人摸象,
家园 这种深度学习的能力,最容易推广的是给人看病。

也许以后的医生都是科学家了,就是研究新的治疗方法,看病这种服务行业就都是计算机了。

这样马前卒忧心忡忡的医保问题就解决了。

家园 记得多年以前中国曾用类似的思路

当然水平远逊来模拟名中医关幼波看肝病,不知后来如何。

家园 看病我觉得有点更难,住院的还好一点

门诊就更麻烦了,一个人看了一次病不来了,是看好了,还是不信任你去别家了,还是治死了,都不知道!

干扰的地方还挺多,毕竟哪个病人也不是照着教科书得病的

这个反馈的链条不闭环,干扰因素更多,不像围棋,最后赢了输了还有个标准

不过大数据嘛,据说啥都能一勺烩喽,师母已呆吧!

家园 这个还真不是宣传

我也恰好做了这个方面的一点工作。人工神经网络起源于模仿人类的大脑信号传递方式,深度学习是人工神经网络的一种深化,业内人士对这个消息应该不是很吃惊。毕竟早在2015年初计算机在图片识别方面超过了人类,这个在业内比围棋更令人关注。总的来说,图片的维度比围棋更高,当然这两个方面可能是各有不同的难度。

百度和谷歌的搜素,无人驾驶车等都大量采用了深度学习技术。无人驾驶的样车都已经上路很长时间,大家都估计商品化也就是5年内的事。业内有些人开玩笑说:“十年后有人驾驶汽车是违法的”。

通宝推:盲人摸象,
家园 我认为将来无人驾驶是解决城市拥堵的终极解决方案

将来除了发烧友,大家都不买车了,都加入租车俱乐部

根据实际需要租用无人驾驶汽车

多人顺路搭乘将是主流,避免一人一车浪费道路资源

也不会有一大堆车平时趴在停车场

至于春节、小长假这种集中、放射性的单向流动咋搞,我还没想好

通宝推:盲人摸象,
家园 技术上确实有突破,值得期待在其它领域上的开发。

至于人机围棋对抗,我还是认同俞斌说的,职业选手对围棋的理解更加深广,远非仅靠模仿和自学的机器能够比拟。

我很奇怪,这次怎么没有先在国际象棋上再搞搞人机大战。

围棋的变数太大,就算机器把所有李世石的棋谱都学习了,李世石也可以临场出新手让机器无“路”可循。

家园 做个标记,过几个月来写个深度分析

过几个月我正好要做一个相关的报告。

到时候发一点上来:)

希望自己别太懒。

家园 这次挑战AI的赢面不高

跟大学时下铺的兄弟聊过,他跟樊麾下过,也知道这个新的围棋软件。他的看法是软件的进步是明显的,的确在某些方面达到了职业棋手的水平,但缺点也是明显的,他就可以稳赢。所以,李世石应该会赢。不过,以AI的学习能力,记忆能力而言,相信再过几年就难说了

家园 国际象棋上计算机早就碾压人类了

国际象棋和中国象棋上计算机早就碾压人类了,还有什么意义再搞人机大战啊。

家园 AlphaGo的开发者可是很有信心啊

据AlphaGo的开发团队中的一个台湾业6透露,他们团队在全力备战与李世石之战,看的出他们很有信心,他甚至说将来可以把目前的世界最强者柯洁打得只有5%的胜率,真能到这一步那就算是碾压人类了。

家园 他也不一定稳赢啊

我不懂AI,不过有种说法是AlphaGo是遇弱则弱,遇强则强,它总是选择最稳妥的路线去战胜对手,所以和樊麾的对局看起来水平就比樊麾稍高一点,而与李世石对战的时候就会表现的比李世石稍高一点了,听起来有些恐怖啊。难道计算机已经在明确围棋规则和目标以后,找到了围棋的最佳解了吗?

家园 遇弱则弱,遇强则强。这个我觉得就是个弱点

因为AI不懂得战略欺骗,如果真人棋手在对弈过程中,时不时地下一两步无理手,或者声东击西,不知道AI如何应对。AI毕竟是根据棋手当前的棋进行深度计算的,否则它的广度运算量太大。

全看树展主题 · 分页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河