西西河

主题:AlphaGo和F-35 -- 晨枫

共:💬78 🌺303 🌵1 新:
分页树展主题 · 全看首页 上页
/ 6
下页 末页
              • 家园 shallow or deep?

                shallow policy和deep policy(deep learning)到底有多大的区别,从数学上看,两者确实没有多大的区别,只是描述的维度不一样而已,deep learning的泛函维度更高。但是从现实中来看,两者其实是有本质的区别的,deep policy在各个方面碾压传统shallow policy,只是这种“本质”区别超出了人类目前的认知水平而已

                樊麾赢的两局棋谱没有公开,但是我们知道这两局是在“快棋”中赢的,AlphaGo确实犯了错误,犯的错误很简单,时间不够,所以收敛到了局部最优解

                比较有意思的问题是,利用AlphaGo,我们也许在不久的将来就会知道,围棋里是不是有“必胜布局”存在,直观的感觉上,“必胜局”应该是存在的,所以围棋的规则也许会在今后的某一天出现非常大的变化,其目的就是为了限制“必胜局”,也许要恢复“座子制”?那可真有意思,春秋战国的中国人,是在外星人的指点下,穷尽了围棋的所有可能,发明了这么神奇的东西?

                那么更有意思的问题是,利用DeepMind Health,是不是有一天我们会从另一个维度证明了中医里的精华的正确?细思极恐。。。

                • 家园 这个我同意

                  樊麾赢的两局棋谱没有公开,但是我们知道这两局是在“快棋”中赢的,AlphaGo确实犯了错误,犯的错误很简单,时间不够,所以收敛到了局部最优解

                  问题是,究竟多长时间才能收敛到了局部最优解?有没有某些局面(比如加藤英树提到的“复杂的对杀和连环劫”)需要太长时间而导致后面的棋没有足够时间?AlphaGo有没有能力避开这些局面?

                  我对围棋AI也是乐观其成的。期待有一天AI能解答几个我比较感兴趣的问题:

                  1. 黑棋的先手优势究竟有多大?我感觉围棋的最终结局是和棋,因为合理的贴目应该是个整数。

                  2. 人类跟“围棋之神”的差距究竟有几个子?

                  3. 中国古棋水平(如范西屏,黄龙士)究竟有多高?

                  • 家园 第一个问题是“多长时间才能收敛到全局最优解”吧?

                    1、真正收敛到全局最优解,这个时间可能仍然是一个天文数字,有文章说狗狗每秒能够计算10万种棋路,这一方面得益于硬件的发展以及谷歌、英伟达等专家专业的优化,另一方面深度学习能力强,在做到跟传统方法一样好的程度的时候,一般确实要快很多。但这比起围棋全部的可能变化,仍然太渺小了,所以狗狗一般来说,找到的可能还是局部最优解,只是这个“局部”比我们人类找到的解的“局部”要大很多而已

                    2、基于这样的判断,所以狗狗应该不是穷举了所有变化,仍然舍弃了很多,因此应该不会存在需要太长时间导致后面时间不够的情况,因为时间紧就多丢一些就行了,解没有那么好而已,人在读秒的时候也是一样的策略。从比赛上来看,狗狗应棋的时间是相对比较均匀的,这其实是一个已经设定好的策略,不是狗狗自己决定的

                    3、对狗狗来说的复杂局面,应该有,但估计只有等狗狗未来自己去发现,我们人类是发现不了的(但人类可以借助狗狗的力量来发现)。其实以目前人类的科学和技术水平,人类和狗狗完全是两个不同位面的生物,相互之间都是沟通不了的,人理解不了狗狗为什么那么强大,找不到它的弱点,但是狗狗也一样理解不了人类找不到人类的弱点,它战胜人是因为它比人强,或者说人要用自己的弱项去挑战它的强项,而不是它利用了人类的弱点。所以就像樊麾说的“像面前有堵墙”,它就是这么简单粗暴地跟你“刚正面”,没有策略没有计谋,然后就赢了。它其实并不知道“打劫”对人类来说有多困难,所以觉得狗狗会主动回避“劫争”的,真的可以洗洗睡了,它回避是因为它觉得不必要,它挑起是因为它觉得必要,跟我们人类无关

                    4、如果人类如有神助,提前发现了狗狗的弱点,那么恭喜你,以狗狗或者说狗狗设计者目前的能力(或者说整个人类目前的能力),是回避不了的。因此值得高兴的地方是,人类可以发展自己,努力去理解狗狗,但是狗狗不会这样做,它不会主动来试图理解我们人类,因此除非有“Dr. Evil”教会狗狗具有主观能动性,狗狗就仍然是狗狗,人类仍然是主人

                    • 家园 神佑人族

                      昨天才说到如果人类如有神助,提前发现狗狗弱点,今天就现世报了。。。

                      狗狗和小李你们这是商量好了拍大片么,这节奏也太好了,配合太默契了

                      按理说,这种完全没有理论指导的盲目试错型软件测试,顺利找到BUG的可能性跟抽中五百万可能差不太多,但就这样眼睁睁地看着它发生了,而且发生得这么快。。。除非,软件的BUG跟筛子一样千疮百孔,也许深度学习目前就是这种状态。。。这个结局,比5:0完胜小李,然后再5:0完胜柯洁要有意义得太多

                      自己不懂围棋,不知道小李今天的下法跟前几局有什么不同,是心态不同了放手一搏呢,还是仍然是像软件测试一样今天测试了一个新的样例,不知道这“神之一手”是经过了设计的,还是临时的灵光闪现,不管怎样,向谷歌高级软件测试员小李脱帽致敬,这种数据太珍贵了,希望谷歌不要独吞。。。

                      • 家园 可能是MCTS的痼疾

                        以下是Martin Müller今天(3/13)在[email protected]上的评论:

                        》So, what would be Lee's best effort to exploit this? Complicating

                        and playing hopefully-unexpected-tesuji moves?

                        Judging from this game, setting up multiple interrelated tactical fights, such that no subset of them works, but all together they work to capture or kill something.

                        For tactical fights, I would expect the value network to be relatively weaker than for quiet territorial positions.

                        So it comes down to solving the problem by search.

                        Aja and me wrote a paper a few years back that showed that even on a 9x9 board, having two safe but not entirely safe-in-playouts groups on the board confuses most Go programs and can push the “bad news” over the search horizon. Now imagine having 3, 4, 5 or more simultaneous tactics. The combinatorics of searching through all of those by brute force are enormous. But humans know exactly what they are looking for.

                        Martin

                        Reference:

                        http://webdocs.cs.ualberta.ca/~mmueller/publications.html#2013

                        S.-C. Huang and M. Müller. Investigating the Limits of Monte Carlo Tree Search Methods in Computer Go. Computers and Games 2013, p. 39-48.

                        Erratum for this paper - in test case 2 Black wins.

                        外链出处

                        外链出处

                        这大概就是加藤英树所说的“复杂的对杀”情况。

                        • 家园 完全理解不能

                          仔细看了一下小李在第四局的表现点评,感觉这是人类智慧的胜利,“增兵减灶”,计谋战胜了机器逻辑

                          小李用多个“不太好”的应手,让机器麻痹大意,自以为胜率已经到了70%以上,于是一如既往的下臭棋来龟兔赛跑,被小李逮住机会来一记精彩的反杀

                          这个策略很可能是设计好的,太精彩了,太伟大了!

                          这个缺陷可能是人工智能在相当长的时间里都补丁不了的,狗狗终究还是狗狗啊,为人类三呼万岁

                          • 家园 机器的逻辑是线性的,非黑即白,一路推下去

                            这也是科学的逻辑,因为科学的对象是自然,而自然相对稳定,基本上不变,所以,线性的非黑即白的形而上学逻辑适用,人就不同了,人变,可以否极泰来,也可以乐极生悲,死地可以是死地,也可以置之死地而后生,以弱胜强

            • 家园 和我的看法类似

              以我的思考来看,电脑应该有能力算出来开劫的地方没有开劫的必要性。从而从不给人类打劫的机会。换句话,一个更可怕的情况是,几千年来,人类下出的各种劫都是不必要的,可以避免的?

              • 家园 如果各种劫材的价值可以准确的算出来,打劫就是不必要的

                问题是人在计算各种劫材的价值时会犯错误,可是机器不会,因为,一个劫材的价值就是一个死活题的价值,可以说都是局部的,局部的小棋早就是机器赢了

        • 家园 “模仿棋”

          还有非常好奇,如果跟狗狗下一局完完全全的“模仿棋”,不知道它会如何应对呢

    • 家园 刚用爪机写了一大堆回复,然后系统突然崩溃

      泪啊,回头再慢慢写了。

分页树展主题 · 全看首页 上页
/ 6
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河