西西河

主题:人类在所有竞技项目上输给机器是必然的 -- 贼不走空

共:💬63 🌺183 新:
全看树展主题 · 分页
/ 5
上页 下页 末页
家园 发不起工资是搞笑的

关键是Google搞阿法狗的目的不是为了拿围棋冠军的啊。现在公认的世界冠军已经被拿下,向全世界证明了人工智能的实力,这就够了。

再和柯洁下一盘?赢了,能比现在更轰动吗?输了,倒替柯洁作广告。

参加职业围棋联赛?拿个棋王大满贯?这是要砸掉所有围棋人的饭碗啊。

一个人画成一条蛇,很好,再加四只脚就过了。

家园 不幸言中

一转眼一年又两个多月就过去了,阿狗刚刚赢得了与柯洁的第一局对弈的胜利

在赛后的新闻发布会上,从谷歌员工的口中亲耳得证了一年多以前的这个猜想

第一,谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练,从而在布局与中盘阶段(这时候严格来说应该胜率起伏不是太大,因此胜率偏导落子的梯度较小),给阿狗以有意义的目标,避免丧失目标下臭棋。从整局的情况来看,我猜测阿狗这次搞了两套模型,一套是这种multi-task的,用于布局与中盘,另一套是原来单一task的,用于收官,因为这时候从策略上看,应该以求稳为主,而且梯度噪声的影响会比较小了

第二,谷歌声称这一代阿狗较上一代,计算量减小了一个数量级,也即10%,那么非常直观地,可以较为肯定地猜测,阿狗2.0采用了MobileNets网络架构,从论文上看,也基本上是正好运算量降一个数量级(Million Mult-Adds: 462->52.3, 4866->569)

第三,有记者提到了这个问题,但是估计是同传没有表达清楚,谷歌的回答有点文不对题,就是这一代阿狗是不是完全靠左右互博训练出来的。猜测应该有那么一点意思,但是还不够彻底。从谷歌的回答上,模模糊糊感觉value net的训练还是靠阿狗1.0的互博至终盘的结果,因此理论上不能说已经完全脱离了最初用于训练的人类棋局的影响。另一方面,从MobileNets方面来看,采取了一个比较重要的训练手段就是distillation,那么阿狗2.0也很有可能是从阿狗1.0上蒸馏出来再进一步训练的。因此现阶段就说是从零开始学围棋,可能还不是非常客观的

第四,谷歌提到这一代阿狗下棋,采用了10个TPU处理器。这个就不深究了,反正前几天google I/O上也说了,估计英伟达老黄会感到菊花一紧吧

最后一句,去年跟一个叫pattern的兄弟谈到关于阿狗左右互博里牵涉到的unsupervised learning的问题,看看这一年来火得发烫的各种GAN,也只能说当初我们的想像力都还不够,哈哈

家园 柯洁没做到的事情,或许我们可以做到

就是击败“阿法狗”。

首先说明,我不会下围棋,一点不会。

“阿法狗”是没有灵魂的,这就是它的缺点。它精确研究了古往今来所有顶级围棋高手,李世石和柯洁都不可能做得到,所以“阿法狗”可以碾压柯洁。

我的做法是这样:到围棋学校去,找一个或几个少年,刚入门,知道围棋规则,但没有段位(业余段位也没有)的,跟“阿法狗”下。

柯洁最多只能让“阿法狗”的机箱发烫,因为柯洁受到过完美的训练(也就是想象力扼杀),他再怎么耍高级花招,“阿法狗”都见识过。

下赢“没有灵魂的围棋上帝”,唯一办法就是让它死机,它自己下不下去了,它没法理解。这不是派个儿童去乱下,而是在规则以内,设法赢。你走一步,“阿法狗”走一步,理论上有赢“阿法狗”的几率,或者说比方另一个AI,“阿法牛”有赢“阿法狗”的概率。

这不是随便拉几个少先队员就可以的,不是耍赖。几十万学员里,找哪几个,这个还有很多讲究,需要一个团队来构思。但我深信做得到。

AI再强大,必有它的罩门,这个捉迷藏还是很好玩的。

人类最好能赢“阿法狗”(不是侥幸赢一局),不然的话,科技还要不要再发展,都是个困扰了。

家园 这个不是你想的那样王八拳

围棋毕竟有胜负规则,一个非专业选手,局部对杀都不合格,更遑论全局观。

你是想找出狗的BUG吗?

冯氏体系的机器OVERFLOW肯定会出BUG,但是这个和下棋结合起来,只能说费效比低得令人发指。

家园 不是王八拳

AI必须破掉,否则就不要发展。

美国人不破,逼得中国也跟着先发展AI再说,这是不正常的。但既然围棋是中国的国术,理直气壮立个项,国家动用资源,去研究怎么破,很正常。

破的方法,分两部分。耍赖,就是破坏AI系统,硬件破坏/软件破坏;不耍赖,就是下赢它。这两个都要试。

聂卫平说它是20段,就不敢试了?你不唯物主义嘛,绝对论嘛。照这样子,主席革命怎么可能成功?

我昨天跟朋友聊了几招,先不说。

家园 我也跟着聊几句

即使你不是专门搞AI有关专业的,只要是接触过一点科学计算,这个结果就应该一点也不意外。计算机的办法就是两个,化难为烦、化思想为记忆,所受的限制是硬件和软件加起来足够快。一旦这个难能转化成烦,人脑的记忆和运算能力只能被甩得越来越远,所以窃以为老本的方法不行。当然这个化难为烦的过程得人来设计。你可以设计个更快更有效的机器、用大炮打败火枪,但换个拳法套路大概不解决问题。

炒股这种事,一方面是还是速度的问题,计算机要能处理关于所有股市参与者的行动的信息,而且要能在变化之前做出决策。另外一个问题就是正确决策的标准要相对稳定,对和错之间不能很容易就变了。

家园 你这个看法离阿花狗的工作机理相去太远。

你这个看法离阿花狗的工作机理相去太远。 阿花狗是在现有物质基础上创造出了一种“智力” 。 和人的不一定一样,但证实更有效。 这个“智力”也就是算法不是逻辑推理式的,而是具备一定抽象能力, 能够将不完全信息(完整对局)总结成“直觉”“感觉”也就是策略网络里的权值。

对于骗招,人类棋手之前曾经有过深入拆解,了解了在正确应对下会吃亏,所以是骗招。 之所以骗招会有效,那是因为成为定论后,人类棋手不会去记具体怎么惩罚对方,从而出错。所以人机大战里常出现人类棋手说这手有问题,但又拿狗没办法。而错招则过于明显,现场推算几步就可以惩罚。狗在对局中,均势情况下绝少出错招骗招。

没出现过的走法,可能成立也可能不成立。 而骗招错招则可以在信赖人类积累的基础上认为基本是会受损的。 阿花-lee的对局里常有评论是“不该这么走”,而阿花-master 则主要是“没见过这么走”。 可见棋手的经验在已知范围内是正确的--“骗招错招就是骗招错招,非常见手必然难以判断”

找人没用过的走法相当于对狗出骗招错招,会被惩罚得很惨。非常见手则根本算不过。

国内AI在看过论文后还比不上阿花-master,但和阿花-Lee也许是接近了。这次阿花-master是自我对局训练的。 这其实是个实践-总结-反馈-实践 的循环。 是不折不扣的智能。

现在通用型人工智能所缺最大的一点是抽象能力。从经验中抽象出概念,在概念的层次上使用算法,得到用概念描述的结论,再从概念反馈到实践中去。 这是一块根本性短板。

另一个是现在这种智能是不是只对特定思维模式有效。 但这个问题比较小,范畴论的很多研究应该可以直接用上。

通宝推:脊梁硬,
家园 人类在运算上输给机器不丢人。

机器老早就在四则运算上碾压人类了,阿法狗现在只是在更高级的运算上碾压人类而已。

老兄一不下围棋,二来貌似也不了解阿法狗的运算逻辑,那就没有必要在这方面做“民科”了。

家园 我的办法是让阿法狗“失忆”

阿法狗没有灵魂,也就没有原创能力,如果它读过的海量棋谱都记不起来了(或记得的是残缺的),单单只完整记得下棋的规则,那还怎么下?

不懂围棋和电脑的人,未必不能赢阿法狗。韩信当兵时,从没有带过一个小队,怎么一拜将就那么牛了?

这已经不是“运算上输给机器”这么幼稚的看法了,你要醒醒了。如果连自己养大的狗(阿法狗)都打不过,万一门外来一头狼(外星文明入侵),地球人能有持久的斗志吗?

输给阿法狗,输就输呗,人天生就是这么贱,有什么办法------我为这种犬儒感到害臊。

家园 人不是输给机器,

而是个人熟练技能输给了人类知识累积,从石器时代使用工具开始,个人技能再高超娴熟也会被使用更好工具的人打败,而工具则是利用人类累积的知识制造的。也许人类会消亡,而人类累积的知识不会。

家园 老本你这个就是因为对AI没有任何了解啦,

早期的PC上的象棋软件是可以用你这种方法去赢的。因为它的工作机理就是你以为的这样,只有有限的应对模式,一旦你不按常规行棋,它就崩溃乱走了。

不懂围棋和电脑的人要赢阿法狗的办法早就有人想出来了,就是拔插头嘛!你还是想得太多了,思而不学则殆。

家园 说得好像阿法狗是外星球来的一样。

术业有专攻,一跨界就容易扯着蛋。

你这里的言论让我对你刮目相看,刮目相看。

想起两小儿辩日的故事来了。

通宝推:abugg,
家园 你说的意思是人作为个体会消亡吧。

人类都消亡了,人类积累的知识靠谁来传承?靠后来发展出来的智能生物,还是其它星球的智能生物?

家园 你其他的帖子我收获良多,这个思路不行啊

狗狗不是死记规则的玩法,所以不行。

前面看你说的那么笃定,我还在想脑洞开到什么地方去呢,除了停电

网上介绍狗的文章挺多,价值网络和策略网络评估,可以找来看看。

象棋的组合是现有技术可穷举的,最好的结果应该是人对机器可以下和或者先走能胜。围棋因为贴目的关系,所以有时候白棋会占点便宜(我猜的,我会下围棋,但是为什么贴这么多目真不知道,水平比较洼),围棋没有杀帅获胜的概念,只有围地多者胜,为什么第二局柯洁的走棋评价那么高,有文章说他走出了历史上最高的十龙棋,构建了无比复杂的局面,最后还是太复杂了,自己算失了。其实他投子认输的时候,我根本看不出来,虽然心理有预期柯洁赢的可能性不高。第一局最后十几手我基本能看懂,官子,细小的杀局交换,这个初学者基本都要掌握。

我设想的是某种数据组合使得程序崩溃,但是看不到源码的情况下全靠猜测几乎不可能,而且并不知道这个程序曾经下过的棋局数据。甚至很大的可能漏洞不在狗程序上,而在系统环节。

拔电,倒水,或者把对面代狗走棋的博士灌晕了,这些成本可能更低吧

家园 这办法够呛

据说现在的狗是自我进化过来的,也就是说在一个固定的算法下,自己和自己下,然后总结,deepmind。与别人对弈是按照它自己的算法下,估计是算法真的接近围棋的真谛了,围与被围,在一手棋中找到了最大化的效率。

全看树展主题 · 分页
/ 5
上页 下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河