西西河

主题:人类在所有竞技项目上输给机器是必然的 -- 贼不走空

共:💬63 🌺183 新:
分页树展主题 · 全看
/ 5
上页 下页 末页
                • 家园 说得好像阿法狗是外星球来的一样。

                  术业有专攻,一跨界就容易扯着蛋。

                  你这里的言论让我对你刮目相看,刮目相看。

                  想起两小儿辩日的故事来了。

                  通宝推:abugg,
                • 家园 老本你这个就是因为对AI没有任何了解啦,

                  早期的PC上的象棋软件是可以用你这种方法去赢的。因为它的工作机理就是你以为的这样,只有有限的应对模式,一旦你不按常规行棋,它就崩溃乱走了。

                  不懂围棋和电脑的人要赢阿法狗的办法早就有人想出来了,就是拔插头嘛!你还是想得太多了,思而不学则殆。

                  • 家园 如果这个AI坐在一辆M1A1 里面

                    就是说,这是“机械战警”,无人装甲部队。面对这样的对手,你怎么拔它的插头呢?

                    如果这个无人装甲旅去进攻伊朗,1/3坦克被伊朗人骇入,立刻调转炮口打美军,那么美军又怎么去拔叛军的插头呢?

                    如果这些插头跟你没关系,不值得去想办法拔,坦克真的骑到你头上的时候,怎么办呢?

                    这个要怎么破,我不知道,反正规规矩矩走正道,盘面上破的可能性太小(柯洁本以为至少不输给李世石,也能赢一盘,这是他第二盘第三盘没下到完美的原因,心不能静),那么走其他道。给钱给资源,组个班子持之以恒地琢磨,什么时候解出来都行,不努力了不可以-----此獠不破,我心不安

    • 家园 李师师已经试出来了阿尔法狗具有本质缺陷

      这个缺陷不可能靠堆硬件以及摩尔定律弥补,不换算法,战胜人类顶尖永远没戏

      ps:现在象棋已经是手机app碾压特大了~

      • 家园 狗放水让李世石10年结婚纪念日有个惊喜而已

        前3局狗每步平均耗时2分钟,第4局前半局耗时不到1.5分钟,漫不经心的样子。

      • 家园 现在狗咬人不是新闻了,人咬狗才是新闻

        这是阿尔法狗出现以后的最大惊诧,本来不是对手的,现在争论的是找AI的缺陷。

        人类刚刚又走过了一个拐点。

      • 家园 时间都去哪儿了……

        孙子兵法有云:胜可知而不可为也,顶尖高手之间的对决,就是走好自己的路,耐心等待对方出错,任何一个小小的情绪波动都可能让对方出错,如果双方都始终以禅定无我的状态谋势布局,那这盘棋局就可以隽永了。

        而现代社会没那么多时间,设置读秒阶段就是逼人类出错,一定要决出个胜负来,夫唯不争 故天下莫能与之争,只要你去争,就落了下乘,胜负心本来就是一种“执”一种“恶”。

        比海洋更宽广比天空更广袤的是心灵,寂然凝虑,思接千载;悄焉动容,视通万里,无限虚空才是人类的力量所在。

        毛泽东思想也讲,你打你的,我打我的,不按常理出牌才是人类制胜之道,在有限的棋盘中,在确定的规则内,不是人类的优势所在。

      • 家园 不一定

        小李的胜利首先是明确证明了一件事,狗狗在领先状态下(至少是在它认为的领先状态下)下出的臭棋就是臭棋,不是人类还理解不了的妙招;另外还证明了一件事,狗狗对胜率的判定存在偏差或者错误,如果说在78步后狗狗觉得胜率有70%还不能证明这一点的话,到第87步才陡降至40%以下就能确认了。这就是狗狗目前存在的BUG,也是小李借以获胜的关键

        解决第一个问题的难度不是很大,修改训练的目标函数,在最大化胜率的同时,同步最大化获胜目数,做一个multi-task,让机器不仅要胜,而且要大胜,就算最终没能大胜,前面建立的优势可能会使得突然崩溃的可能性更低。这个既不用堆硬件也不用换算法,打个小补丁而已,训练时间三个月到半年以内。这个会引起新的风险,机器可能为了追求大胜,像人类一样进行冒险,这就要看谷歌调参的功力了(如无意外应该是天下第一。。。)

        第二个问题有点棘手,问题的根源不太清楚,但按照深度学习的思想,找不到问题就采取暴力,再猛跑几亿个棋谱,问题还是没有解决,但是完全有可能更隐蔽了,毕竟要战胜人类顶尖并不需要是神,只需要比人类顶尖强一些就行了

        最最关键的,我们想得到的,谷歌肯定也想得到,我们想不到的,谷歌还是可能想得到,所以还是有很大的可能,不堆硬件不换算法,再等几个月时间,狗狗就能战胜人类顶尖了

        通宝推:崇文尚武,
        • 家园 不幸言中

          一转眼一年又两个多月就过去了,阿狗刚刚赢得了与柯洁的第一局对弈的胜利

          在赛后的新闻发布会上,从谷歌员工的口中亲耳得证了一年多以前的这个猜想

          第一,谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练,从而在布局与中盘阶段(这时候严格来说应该胜率起伏不是太大,因此胜率偏导落子的梯度较小),给阿狗以有意义的目标,避免丧失目标下臭棋。从整局的情况来看,我猜测阿狗这次搞了两套模型,一套是这种multi-task的,用于布局与中盘,另一套是原来单一task的,用于收官,因为这时候从策略上看,应该以求稳为主,而且梯度噪声的影响会比较小了

          第二,谷歌声称这一代阿狗较上一代,计算量减小了一个数量级,也即10%,那么非常直观地,可以较为肯定地猜测,阿狗2.0采用了MobileNets网络架构,从论文上看,也基本上是正好运算量降一个数量级(Million Mult-Adds: 462->52.3, 4866->569)

          第三,有记者提到了这个问题,但是估计是同传没有表达清楚,谷歌的回答有点文不对题,就是这一代阿狗是不是完全靠左右互博训练出来的。猜测应该有那么一点意思,但是还不够彻底。从谷歌的回答上,模模糊糊感觉value net的训练还是靠阿狗1.0的互博至终盘的结果,因此理论上不能说已经完全脱离了最初用于训练的人类棋局的影响。另一方面,从MobileNets方面来看,采取了一个比较重要的训练手段就是distillation,那么阿狗2.0也很有可能是从阿狗1.0上蒸馏出来再进一步训练的。因此现阶段就说是从零开始学围棋,可能还不是非常客观的

          第四,谷歌提到这一代阿狗下棋,采用了10个TPU处理器。这个就不深究了,反正前几天google I/O上也说了,估计英伟达老黄会感到菊花一紧吧

          最后一句,去年跟一个叫pattern的兄弟谈到关于阿狗左右互博里牵涉到的unsupervised learning的问题,看看这一年来火得发烫的各种GAN,也只能说当初我们的想像力都还不够,哈哈

        • 家园 觉得谷歌如果是为了测试程序,这个比赛形式不对

          总共五盘比赛,李前三盘一个bug没找到,测试手段是不少,但测着测着时间没了开始读秒,这还咋想招啊.不说把比赛设定为不限时,至少时间宽裕些啊.

          或者赛前谷歌也没想到小李子也这么废?

          • 家园 呵呵,或许赛前谷歌也没想到小李子这么猛

            楼下岑子说得很透彻了,比赛的设定确实不太利于人类的,宣传可能是主要目的

            赛前谷歌可能不是没想到小李子这么废,而是没想到小李子这么猛,至少我自己在赛前是几乎肯定小李子会被洗个5:0的,估计在深度学习这一行里的绝大多数都会这么认为,因为我们已经习惯在各个方面被机器碾压了。。。

            看到很多地方说这个比赛对小李不公平,因为赛前对系统不了解,也没有测试局,这个因素确实存在。也正因为此,在仔细看了第4局的点评之后,我对小李瞬间路转粉,之前在我眼里他就是一团炮灰,现在我觉得他就是《独立日》里的史蒂夫

            我觉得这次比赛,在测试了深度学习的同时,也一样测试了我们人类,如果真的有AI天网,如果真的有外星人入侵,它们一定就是像阿尔法狗一样突然出现在我们面前,我们对它们不了解,它们也不会跟我们搞什么测试,但是人类的潜力仍然使得我们有胜利的希望。鉴于深度学习确实存在演变成AI的可能,这个和当年的深蓝有本质的区别,我觉得今后测试深度学习干脆都这么干,至少有个预警,或者死也死个明白

            • 家园 比赛之前,谷歌团队内部估算小李子没有胜算

              5:0是刚刚的结局。

              第3局,小李子拿棋的手都在发抖。

              第4局的日子是小李子结婚10年纪念日,老婆孩子都不敢到现场观战。

              谷歌是什么公司?这点人情世故都不知道?以后怎么在东亚这种讲面子的地方混?

              3:0赢和3:2赢有什么差别?尤其已经是3:0了。

              为了让小李子心里明白,第5局狗还是轻轻松松地碾压。

              现在就看宇宙第一高手柯洁还敢不敢口出狂言了。

          • 家园 不錯, 要測肯定是請專業棋社組隊測

            在堆配置的情況下, 运算速度不是大問題, 電腦也不会出現忘掉變化图的情況. 人在比賽中这2點都是有限制的, 長考用時有限, 局勢太複雜時也不能用笔把棋局抄下, 何況人会疲勞和大意, 令水平下降, 不能盡情發揮. 事實上, 圍棋的定石和飛刀都是實戰前研究所得, 也許有天才靈光一閃的想法, 但普通人補缺查漏也很重要, 要知看棋高三段, 團隊合作能做出更強應對是有效和合理的, 吳清源出道時与秀哉下出那場"三三、星、天元", 秀哉年邁力衰, 正路下不過少年天才吳清源, 但憑着無限用時和徒弟团隊, 还是能把吳清源斬於馬下, 可見人類的最高棋力必然不是出於比賽場中, 而是在研究室內.

            數十年前, 一盤職業圍棋賽可以下數天, 双方有充足時間長考, 近年為了照顧電視直播, 比賽用時愈來愈短, 快棋賽也愈來愈多, 这是不利於棋力提升的, 但利於吸引觀眾. 本次比賽每方用時2小時不算快棋, 但在常規比實中絕对不慢. 一般情況下棋手思考時, 除了自己的用時, 对方思考的時間也能用上, 每方用時2小時相當於頭4小時的可以慢慢想清楚. 阿發狗一堆配置, 時間上对它就不重要了, 結果李世乭用光2小時, 它才用得1小時, 这情況在人類比賽中不会出現, 总時間約3小時的对局是双方1.5小時的快棋了, 進一步限制了李的發揮.

            在限制人類發揮同時大力宣傳, 賽制也是更适合直播的3小時制, GOOGLE設計出的这場比賽, 測試只是借口, 宣傳才是目的

            通宝推:崇文尚武,
分页树展主题 · 全看
/ 5
上页 下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河