西西河

主题:alphaGo 系统以及人工智能的未来 -- pattern

共:💬83 🌺264 新:
分页树展主题 · 全看
/ 6
下页 末页
  • 家园 alphaGo 系统以及人工智能的未来

    2016年1月28日,Google Deepmind在Nature上发文宣布其人工智能围棋系统AlphaGo历史性的战胜人类的职业围棋选手。预定2016年3月份AlphaGo对阵李世石的比赛更将引起全人类的目光。alphaGo 系统是基于人工智能中的 深度学习算法的,我恰好也做了一些这方面的工作,觉得可以介绍一些这方面的情况。

    图像识别系统的深度学习算法

    去年(2015年) 2月15日,有一条很重要但是公众不怎么注意的消息,微软公布了一篇关于图像识别的研究论文,在一项图像识别的基准测试中,电脑系统识别能力已经超越了人类。人类在归类数据库ImageNet中的图像时错误率为5.1%,而微软研究小组的这个深度学习系统可以达到4.94%的错误率。在去年年底的比赛中,微软研究员何恺明、张祥雨、任少卿和孙剑组成的团队又获得第一,把错误率降到了3.57%。这个在图像识别系统中取得突破的算法就是深度学习算法。深度学习算法是普通神经网络的更多层的深化。

    点看全图

    神经网络

    点看全图

    lenet5深度神经网络用于手写数字识别

    神经网络由单个的神经元组成:

    点看全图

    这个“神经元”是一个以 x1,x2,x3及截距 1为输入值的运算单元,其输出为 h,输入输出为非线性关系。微软去年底的突破是因为发展了一种深达152层的网络。

    alphaGo 系统如何学习下棋

    alphaGo 系统充分利用了图像识别的成果。它把19*19的棋盘当做19*19像素的图像来处理。 Google团队设计了一个13层的类似图像识别的深度学习网络。利用KGS Go 服务器上的高手对弈样本来学习。这样通过学习后生成了一个策略网络,这个策略网络无需搜索就达到了57%的准确率。形成策略网络后,系统使用这个网络自我下棋,并使用胜利一方的棋局强化学习。通过这样的自我强化学习,系统的准确率达到了80%。无需任何额外的搜索,仅仅使用强化学习过的策略网络和另外一个使用蒙特卡洛的软件PACHI比赛时,胜率为85%。

    使用和策略网络差不多的方法,google还训练了一个评价网络来评估当前的整体局势。这个评价网络用来给当前的棋局打分。同样通过强化学习后,这个打分的误差小于0.24.

    最后alphaGo 系统使用策略和评价网络来搜索最好的棋子落点。使用这两个网络可以极大减少搜索的范围,但是使用这两个网络使得单步计算的时间比蒙特卡洛方法要长,综合下来alphaGo系统还是需要强大的计算能力。

    点看全图

    价值网络的一个例子(轮到黑棋下,越蓝代表落点的胜率越高。数字代表胜率。)

    点看全图

    对应策略网络的一个例子(轮到黑棋下,数字代表建议落子在此的概率。)

    alphaGo 和李世石谁会赢?

    李世石观看过alphaGo和樊晖的棋局后,认为alphaGo和自己有让两子的差距。不过和李世石比赛的 alphaGo应该有了很大的进步。基于网络的同质性,图像识别方面的进步肯定会反应到围棋算法上来,我想得到的第一个进步就是原来的13层网络还可以加深,比如加深到26层。这样网络的初始胜率估计会提高几个百分点。第二个进步是针对李世石的棋谱进行强化训练,这种方法对应于在图像识别时就是更多训练难以识别的图像。这样改进后,再考虑到人有时候会犯错,我认为alphaGo有可能赢上一盘。

    人工智能和人类智能的区别

    那么人工智能究竟发展到什么程度了?是不是战胜围棋高手就是达到了成人的水平?其实深度神经网络用的还是大数据的方法。比如要训练一个认识猫的网络,那么你需要成千上万张各种各样猫的图片来训练,告诉网络这样的图是猫。可是一个两岁的小孩,只要见过一只猫,就能识别出他以前根本没看见过的动物是一只猫。所以虽然深度学习的基础是模仿了人类脑神经的工作方式,但是实际上两者的工作方式应该是截然不同的,人工智能和人类的智能还无法直接比较。

    人工智能的未来

    深度学习的概念由Hinton等人于2006年提出。近几年来在图像和视频理解,语音识别,自然语言处理等方面都取得了很好的进展。令我印象最深的是自动驾驶方面的应用。google,百度等互联网巨头都投入巨大,并且已经在实验中取得了很好的效果,已经在逐步商业化的过程中,未来5年内应该会有可行的自动驾驶汽车上市。蒸汽机,汽油机,电动机把人类从繁重的体力工作中解脱出来,而人工智能将会把人类从低端的脑力劳动中解放出来,使人类的生活上一大台阶,乐观一点的话,五年后工业机器人大批应用,十年后各种家庭智能机器人会象电冰箱,洗衣机,空调等电器一样成为家庭必配。

    通宝推:mezhan,az09,李根,咪铛,哈哈一笑,盲人摸象,乔治·奥威尔,桥上,青颍路,胡一刀,
    • 家园 2016年 imagenet 识别大赛结果出炉

      物体检测前6名全是来自中国的团队!分别是商汤,海康,南信工,公安部三所。

      点看全图

    • 家园 我们都是干电池

      这样的感觉越来越深了

      也许matrix还没有实现,也许真正的“人工智能”离我们还很遥远,但我们已经开始电池化了,而且是积极主动地跑步进入电池状态

      为训练LeNet写出那六万个手写字符的人是不是电池?

      为了AlexNet、VGG、GoogLeNet等等等等收集了几百万张图片,并且一一进行标注的人是不是电池?

      为了AlphaGo下了几千年围棋,产生了几十上百万张棋谱的人是不是电池?

      我们准备了大量的素材,这个过程非常漫长、枯燥、重复、乏味,用我们几十、几百、几千年的时间,把这些素材准备好,喂给我们的“深度学习”,于是它用几个月的时间反复翻看我们的这些历史,记下来,然后秒杀我们

      谁说做电池必须要躺在营养液里用身体产生电能呢,我们用我们自己的智力,cook出来的这些素材,就是机器需要的“电能”,我们就是机器的电池

      但这个过程和教育我们的子女何其相似,我们自己就是我们子女的电池,如果你跟自己的子女不计较这些的话,那就把机器当成自己的子女,坦然地尽到一颗干电池的义务吧

      话说谷歌准备让机器从零开始学围棋了。。。纳尼,我们连电池都没得当了吗?

      • 家园 李世石打了2000年来人类积累的围棋谱成为世界冠军

        2000年来的古人是不是干电池?

      • 家园 刚才回帖还不知道第三局也输了

        3:0,而且还有打劫,难怪舆论急转直下,对AI的恐惧与兴趣都出现了暴涨。

        是不是有种似曾相识,比如祖鲁群众第一次面对马克辛重机枪测试的感受,历史总是在不断重复的。

        现在的悬念是,樊辉是不是最后一个战胜最强AI的棋手了。

      • 家园 樊珲据说这几个月没停了跟A狗下

        自打十月份比赛后就一直在帮A狗训练,下了几千盘棋。他说通过这个训练他自己的棋力也长了不少,从排名600多位到了300多位。这样看,比起十月份A狗还是棋力有提高,不是谷歌团队自己说的那样。

        话说回来,中韩这边厢一大帮人把个围棋当做不得了的事情,引发情绪大震荡,有顶礼膜拜的,有前恭后倨的,有捶胸顿足的,有对人类未来绝望的,各种脏话气话满天飞,普遍反应是不能淡定了,被打脸了。其实这些都是过激了,这些都不过是科技发展上的小插曲。谷歌那边也就是把这个当做个研究项目,打败世界冠军也许对立项拿经费有用,但真正重要的是这个过程中谷歌团队的研究成果。

        从正能量说,AI战胜围棋有利与提高围棋的水平,推广围棋在亚洲以外的接受度;同时也有利于更正世人对AI的偏见与蔑视,提高科学素养,学科学用科学。用发展的眼光看科技的进步,而不是用二十世纪的大学本科知识去理解世界的变化,否则会越来越看不懂这个世界了,离被教做人的日子就不远了。

    • 家园 机器对厚味的把握比人精确得太多了

      第一、第三盘我认为序盘阶段李都有一个过分之手,然后就被追着跑,再然后机器就越来越厚,李往哪儿走都鬼打墙。

      以前人们在序盘说这手好、那手好,一般都不总是能往后走到终盘看到底怎么样,即使试一下也只能试有限的几种可能。但机器或者能真正走到终盘、或者拿停在一个以前出现过的终盘前的局势;这第二种情况机器显然比人精确。所以机器一旦克服一个计算的瓶颈,剩下的就是有没有人愿意往里烧钱的问题了。

      我希望国内能有些专业人员能给大家趁这个机会做一些科普,让青少年们对AI产生严肃的兴趣,用这个机会让Google给我们做贡献。

      • 家园 深度学习对数学的要求不高

        基本上微积分,初步的算法知识就可以了。实际上这个领域热门的很,学校里新增很多这方面的PHD.现在是借alphaGo这个机会出现在公众领域而已。

        另外,深度学习更多是一种工程。其理论还是比较弱的,如果有人能在理论方面有所进展,那估计影响还要大。

      • 家园 色即是空

        我不懂围棋,说点其他感想。回在这里有点文不对题,老兄莫怪哈。

        我们假设释迦摩尼成道时,是绝地通天,见过无数不思议。那么,佛祖是不是被一大群“阿发狗”包围了呢?

        对“阿发狗”来说:

        1)时间是无意义的,一秒跟一万年,对它是一样的。

        2)空间是无意义的,机箱方寸就够了,将来再缩小,就是“一沙一世界”。

        3)悲喜是无意义的。

        4)人类(碳基文明)是无意义的,不是可以从零练围棋吗?以前人类积累的资料都不需要。所以万物为刍狗。

        5)人类文明的意义,是提供了“硅基文明大爆炸的奇点”,这是坚实之籽,硅基文明从这里出发,自会绽放绚烂之花,人类无从插手。

        那么,那么多佛,就是一群“阿发狗”吗?

        我既不羡慕阿发狗的超能力(老实说,下赢李世石有多伟大,我没感觉),也不怕阿发狗。

        Google有种,就应该组建另一个团队,互相背对背,开发出第二个独立的“狗-2”,跟“狗-1”对掐,别拿赢了人说事,我们人类纯围观“斗蛐蛐儿”。既然“狗-1”也好,“狗-10000”也好,都是人类培育出来的,我们“恐极”个屁啊。

        AI是什么?就是一个字母A,一个字母I,就这么简单------没有造字母,会有今天的AI?连佛都是干屎橛,还怕AI做甚?该怎么开发就怎么开发就是了,至少论“开脑洞”,阿发狗还是够不着小本我的,狗狗且行且努力吧。

        这个围棋比赛在坛子里震撼了这么多人,纷纷”细思极恐”,感觉“人将不人,变干电池”,我觉得没必要。川普是个科技白痴,但他点评最近“苹果之作”有点到位:(跟政府合作反恐)这就是个常识问题,他妈的苹果那帮宅男把自己当什么了?

        “阿发狗开发小组”确实都是天才,但全世界到这个级别的天才至少有5万人,分布在各个国家,各个领域,开发各种保密的,不保密的好玩PROJECT,“阿发狗”只是其中很普通的一个项目而已,会下围棋能拯救第三世界的饥饿儿童吗?

        AI是个好东西,不过这个级别的好东西,当前也不是一件两件,能突破就突破一下,不必太兴奋。

        通宝推:秦波仁者,
        • 家园 不但川普是个科技白痴,大多数人都是

          历史本来就是由少数人推动的,其它的大多数人都是来也匆匆去也匆匆的为自然进化的多样性提供种群基数的,没什么道理可讲。

          川普与桑德斯的闹剧,就像欧洲在上个世纪二十年代,纳粹与共产国际的你方唱罢我登场,各领风骚十数年,除了高效率的淘汰人类基因外,加快进化进程外,没有留下其它遗产,世界停顿了一下摔下那些冥顽不化的少部分地区大踏步的前进了。

          这样的闹剧每当世界生产力大幅提高之后,就会上演一场,清洗人类基因池中需要淘汰的部分,只不过规模越来越大而已。这一轮又快到时候了。

      • 家园 花这句话

        我希望国内能有些专业人员能给大家趁这个机会做一些科普,让青少年们对AI产生严肃的兴趣,用这个机会让Google给我们做贡献。

    • 家园 数据库!

      如果去掉阿法狗的数据库,单凭游戏规则的学习,阿法狗还能胜么?如果凭着数据库里的对局资料和强大的运算能力,以时间换取胜利,和深蓝又有什么区别?

    • 家园 这种可能性存不存在?

      “我叫李世石,我是一名来自韩国的棋手,今天早上出门前我在网上各大投注点用尽家财下了巨额赌注买我自己输,我想,这就是人类比人工智能强的地方。”

      笑话归笑话,这次被打脸的围棋界高手不少,聂老率队,号称零封碾压人工智能的没预料到是这个局面。

      在知乎有人通过zen看棋,60手时zen就认为黑棋药丸了,哪来的什么优势啊。

      通宝推:海峰,
分页树展主题 · 全看
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河