主题：人类在所有竞技项目上输给机器是必然的 -- 贼不走空

共:💬63 🌺183 新:

老大河待整

全看树展主题 · 分页上页下页末页

复这个团队不是一般的项目团队

家园

发不起工资是搞笑的

关键是Google搞阿法狗的目的不是为了拿围棋冠军的啊。现在公认的世界冠军已经被拿下，向全世界证明了人工智能的实力，这就够了。

再和柯洁下一盘？赢了，能比现在更轰动吗？输了，倒替柯洁作广告。

参加职业围棋联赛？拿个棋王大满贯？这是要砸掉所有围棋人的饭碗啊。

一个人画成一条蛇，很好，再加四只脚就过了。

复不一定

家园

不幸言中

一转眼一年又两个多月就过去了，阿狗刚刚赢得了与柯洁的第一局对弈的胜利

在赛后的新闻发布会上，从谷歌员工的口中亲耳得证了一年多以前的这个猜想

第一，谷歌应该是采用了这种multi-task的策略来进行这一代阿狗的训练，从而在布局与中盘阶段（这时候严格来说应该胜率起伏不是太大，因此胜率偏导落子的梯度较小），给阿狗以有意义的目标，避免丧失目标下臭棋。从整局的情况来看，我猜测阿狗这次搞了两套模型，一套是这种multi-task的，用于布局与中盘，另一套是原来单一task的，用于收官，因为这时候从策略上看，应该以求稳为主，而且梯度噪声的影响会比较小了

第二，谷歌声称这一代阿狗较上一代，计算量减小了一个数量级，也即10%，那么非常直观地，可以较为肯定地猜测，阿狗2.0采用了MobileNets网络架构，从论文上看，也基本上是正好运算量降一个数量级（Million Mult-Adds: 462->52.3, 4866->569）

第三，有记者提到了这个问题，但是估计是同传没有表达清楚，谷歌的回答有点文不对题，就是这一代阿狗是不是完全靠左右互博训练出来的。猜测应该有那么一点意思，但是还不够彻底。从谷歌的回答上，模模糊糊感觉value net的训练还是靠阿狗1.0的互博至终盘的结果，因此理论上不能说已经完全脱离了最初用于训练的人类棋局的影响。另一方面，从MobileNets方面来看，采取了一个比较重要的训练手段就是distillation，那么阿狗2.0也很有可能是从阿狗1.0上蒸馏出来再进一步训练的。因此现阶段就说是从零开始学围棋，可能还不是非常客观的

第四，谷歌提到这一代阿狗下棋，采用了10个TPU处理器。这个就不深究了，反正前几天google I/O上也说了，估计英伟达老黄会感到菊花一紧吧

最后一句，去年跟一个叫pattern的兄弟谈到关于阿狗左右互博里牵涉到的unsupervised learning的问题，看看这一年来火得发烫的各种GAN，也只能说当初我们的想像力都还不够，哈哈

复二、人工智能不可能战胜人类智能

家园

柯洁没做到的事情，或许我们可以做到

就是击败“阿法狗”。

首先说明，我不会下围棋，一点不会。

“阿法狗”是没有灵魂的，这就是它的缺点。它精确研究了古往今来所有顶级围棋高手，李世石和柯洁都不可能做得到，所以“阿法狗”可以碾压柯洁。

我的做法是这样：到围棋学校去，找一个或几个少年，刚入门，知道围棋规则，但没有段位(业余段位也没有)的，跟“阿法狗”下。

柯洁最多只能让“阿法狗”的机箱发烫，因为柯洁受到过完美的训练（也就是想象力扼杀），他再怎么耍高级花招，“阿法狗”都见识过。

下赢“没有灵魂的围棋上帝”，唯一办法就是让它死机，它自己下不下去了，它没法理解。这不是派个儿童去乱下，而是在规则以内，设法赢。你走一步，“阿法狗”走一步，理论上有赢“阿法狗”的几率，或者说比方另一个AI，“阿法牛”有赢“阿法狗”的概率。

这不是随便拉几个少先队员就可以的，不是耍赖。几十万学员里，找哪几个，这个还有很多讲究，需要一个团队来构思。但我深信做得到。

AI再强大，必有它的罩门，这个捉迷藏还是很好玩的。

人类最好能赢“阿法狗”（不是侥幸赢一局），不然的话，科技还要不要再发展，都是个困扰了。

复柯洁没做到的事情，或许我们可以做到

家园

这个不是你想的那样王八拳

围棋毕竟有胜负规则，一个非专业选手，局部对杀都不合格，更遑论全局观。

你是想找出狗的BUG吗？

冯氏体系的机器OVERFLOW肯定会出BUG，但是这个和下棋结合起来，只能说费效比低得令人发指。

复这个不是你想的那样王八拳

家园

不是王八拳

AI必须破掉，否则就不要发展。

美国人不破，逼得中国也跟着先发展AI再说，这是不正常的。但既然围棋是中国的国术，理直气壮立个项，国家动用资源，去研究怎么破，很正常。

破的方法，分两部分。耍赖，就是破坏AI系统，硬件破坏/软件破坏；不耍赖，就是下赢它。这两个都要试。

聂卫平说它是20段，就不敢试了？你不唯物主义嘛，绝对论嘛。照这样子，主席革命怎么可能成功？

我昨天跟朋友聊了几招，先不说。

复柯洁没做到的事情，或许我们可以做到

家园

我也跟着聊几句

即使你不是专门搞AI有关专业的，只要是接触过一点科学计算，这个结果就应该一点也不意外。计算机的办法就是两个，化难为烦、化思想为记忆，所受的限制是硬件和软件加起来足够快。一旦这个难能转化成烦，人脑的记忆和运算能力只能被甩得越来越远，所以窃以为老本的方法不行。当然这个化难为烦的过程得人来设计。你可以设计个更快更有效的机器、用大炮打败火枪，但换个拳法套路大概不解决问题。

炒股这种事，一方面是还是速度的问题，计算机要能处理关于所有股市参与者的行动的信息，而且要能在变化之前做出决策。另外一个问题就是正确决策的标准要相对稳定，对和错之间不能很容易就变了。

复柯洁没做到的事情，或许我们可以做到

家园

你这个看法离阿花狗的工作机理相去太远。

你这个看法离阿花狗的工作机理相去太远。阿花狗是在现有物质基础上创造出了一种“智力” 。和人的不一定一样，但证实更有效。这个“智力”也就是算法不是逻辑推理式的，而是具备一定抽象能力，能够将不完全信息（完整对局）总结成“直觉”“感觉”也就是策略网络里的权值。

对于骗招，人类棋手之前曾经有过深入拆解，了解了在正确应对下会吃亏，所以是骗招。之所以骗招会有效，那是因为成为定论后，人类棋手不会去记具体怎么惩罚对方，从而出错。所以人机大战里常出现人类棋手说这手有问题，但又拿狗没办法。而错招则过于明显，现场推算几步就可以惩罚。狗在对局中，均势情况下绝少出错招骗招。

没出现过的走法，可能成立也可能不成立。而骗招错招则可以在信赖人类积累的基础上认为基本是会受损的。阿花-lee的对局里常有评论是“不该这么走”，而阿花-master 则主要是“没见过这么走”。可见棋手的经验在已知范围内是正确的--“骗招错招就是骗招错招，非常见手必然难以判断”

找人没用过的走法相当于对狗出骗招错招，会被惩罚得很惨。非常见手则根本算不过。

国内AI在看过论文后还比不上阿花-master，但和阿花-Lee也许是接近了。这次阿花-master是自我对局训练的。这其实是个实践-总结-反馈-实践的循环。是不折不扣的智能。

现在通用型人工智能所缺最大的一点是抽象能力。从经验中抽象出概念，在概念的层次上使用算法，得到用概念描述的结论，再从概念反馈到实践中去。这是一块根本性短板。

另一个是现在这种智能是不是只对特定思维模式有效。但这个问题比较小，范畴论的很多研究应该可以直接用上。

通宝推：脊梁硬,

复不是王八拳

家园

人类在运算上输给机器不丢人。

机器老早就在四则运算上碾压人类了，阿法狗现在只是在更高级的运算上碾压人类而已。

老兄一不下围棋，二来貌似也不了解阿法狗的运算逻辑，那就没有必要在这方面做“民科”了。

复人类在运算上输给机器不丢人。

家园

我的办法是让阿法狗“失忆”

阿法狗没有灵魂，也就没有原创能力，如果它读过的海量棋谱都记不起来了（或记得的是残缺的），单单只完整记得下棋的规则，那还怎么下？

不懂围棋和电脑的人，未必不能赢阿法狗。韩信当兵时，从没有带过一个小队，怎么一拜将就那么牛了？

这已经不是“运算上输给机器”这么幼稚的看法了，你要醒醒了。如果连自己养大的狗（阿法狗）都打不过，万一门外来一头狼（外星文明入侵），地球人能有持久的斗志吗？

输给阿法狗，输就输呗，人天生就是这么贱，有什么办法------我为这种犬儒感到害臊。

复人类在所有竞技项目上输给机器是必然的

家园

人不是输给机器，

而是个人熟练技能输给了人类知识累积，从石器时代使用工具开始，个人技能再高超娴熟也会被使用更好工具的人打败，而工具则是利用人类累积的知识制造的。也许人类会消亡，而人类累积的知识不会。

复我的办法是让阿法狗“失忆”

家园

老本你这个就是因为对AI没有任何了解啦，

早期的PC上的象棋软件是可以用你这种方法去赢的。因为它的工作机理就是你以为的这样，只有有限的应对模式，一旦你不按常规行棋，它就崩溃乱走了。

不懂围棋和电脑的人要赢阿法狗的办法早就有人想出来了，就是拔插头嘛！你还是想得太多了，思而不学则殆。

复我的办法是让阿法狗“失忆”

家园

说得好像阿法狗是外星球来的一样。

术业有专攻，一跨界就容易扯着蛋。

你这里的言论让我对你刮目相看，刮目相看。

想起两小儿辩日的故事来了。

通宝推：abugg,

复人不是输给机器，

家园

你说的意思是人作为个体会消亡吧。

人类都消亡了，人类积累的知识靠谁来传承？靠后来发展出来的智能生物，还是其它星球的智能生物？

复我的办法是让阿法狗“失忆”

家园

你其他的帖子我收获良多，这个思路不行啊

狗狗不是死记规则的玩法，所以不行。

前面看你说的那么笃定，我还在想脑洞开到什么地方去呢，除了停电

网上介绍狗的文章挺多，价值网络和策略网络评估，可以找来看看。

象棋的组合是现有技术可穷举的，最好的结果应该是人对机器可以下和或者先走能胜。围棋因为贴目的关系，所以有时候白棋会占点便宜（我猜的，我会下围棋，但是为什么贴这么多目真不知道，水平比较洼），围棋没有杀帅获胜的概念，只有围地多者胜，为什么第二局柯洁的走棋评价那么高，有文章说他走出了历史上最高的十龙棋，构建了无比复杂的局面，最后还是太复杂了，自己算失了。其实他投子认输的时候，我根本看不出来，虽然心理有预期柯洁赢的可能性不高。第一局最后十几手我基本能看懂，官子，细小的杀局交换，这个初学者基本都要掌握。

我设想的是某种数据组合使得程序崩溃，但是看不到源码的情况下全靠猜测几乎不可能，而且并不知道这个程序曾经下过的棋局数据。甚至很大的可能漏洞不在狗程序上，而在系统环节。

拔电，倒水，或者把对面代狗走棋的博士灌晕了，这些成本可能更低吧

复柯洁没做到的事情，或许我们可以做到

家园

这办法够呛

据说现在的狗是自我进化过来的，也就是说在一个固定的算法下，自己和自己下，然后总结，deepmind。与别人对弈是按照它自己的算法下，估计是算法真的接近围棋的真谛了，围与被围，在一手棋中找到了最大化的效率。

全看树展主题 · 分页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明