西西河

主题:创新才有围棋的未来--再说alphaGo -- pattern

共:💬11 🌺49 新:
全看分页树展 · 主题 跟帖
家园 兄弟你好纠结这个左右互搏啊

我觉得左右互搏能够提高狗狗的能力,能够创新,不会局限于人类棋谱并不存在太大的问题

看你前面的文章,兄弟应该也挺关心深度学习的unsupervised learning吧。其实深度学习用于supervised learning也就是这两三年的事,深度学习是从unsupervised起步的,可以看一下谷歌在2012年CVPR上的那篇关于人脸猫脸的论文。深度学习的最本源理论是华裔数学家陶哲轩的compressed sensing/sparse coding(图灵死之前的研究好像跟这个很类似,他在琢磨怎样用数学公式将奶牛身上的花纹描述出来,可惜没研究完就死了,不然现在我们可能都躺营养液里呢。。。),谷歌最初就是依据这个理论,输入大量图像,要求计算机用最少(稀疏)的特征将所有图像描述出来,然后能进行损失最小的还原,实验的结果,机器从这些图片里挖掘出来了人脸猫脸这些相对抽象的概念,虽然机器并不知道这些概念是什么

换句话说,深度学习的能力是其与生俱来的,只要能设计出合适的loss function,在这个loss function的inference中不存在循环论证,就能解决问题,supervised learning只是把这种能力限制到我们指定的任务中,学习起来可能更快

对于围棋来说,其实这个loss function天然存在,就是最后的输赢,同样的可以参考谷歌从零开始玩像素游戏的论文,目标是得到尽可能高的游戏分数。所以我觉得谷歌说从零开始学围棋并不是一句空话,可行性是非常高的,既然如此的话,那左右互搏能够增强狗狗棋力就是板上钉钉的事情了

非常恐怖而又可悲的一点,在超大型多人在线角色扮演游戏“地球online”或者“宇宙online”中,这个loss function也是天然存在的--生存or灭亡!所以我个人觉得,这可能是一个很危险的尝试

通宝推:乔治·奥威尔,铁手,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河