- 发帖可能变空内容,邪门暂不知所以然
- 『稷下学宫』新认证方式,24年网站打算和努力目标
主题:alphaGo 系统以及人工智能的未来 -- pattern
共:💬83 🌺264 新:
田的分析对搞这行的人来说没什么新意可言,只能算是个科普吧。。。
谷歌的nature文章是早就出来了,但是细节内容有所保留无疑
举个最简单的,比如谷歌说自己和自己下棋,每盘棋是只选了一个局面作为样本来进行训练
但是这个局面是怎么选出来的呢?我想如果是random,那结果一定不会是现在这样的
直观来看,最有效的样本应该是在“胜负手”的位置上,不仅学得的效果会好,而且训练速度也会快不少
当然“胜负手”的判断利用value network是能够做到的,但是这样的话value network和policy network之间一定会有一个成为整个系统的天花板,但是狗狗好像没碰到这个问题,所以一定是有黑科技没有公布出来
- 相关回复 上下关系8
🙂李喆这篇文章说的至今最清楚的 2 乔治·奥威尔 字83 2016-03-11 11:17:38
🙂可能不仅仅代表了过去所有的围棋高手们 2 jahcoo 字670 2016-03-10 21:15:37
🙂田渊栋这里有一篇详细分析 2 乔治·奥威尔 字144 2016-03-10 21:20:46
🙂谢谢链接
🙂什么样的deep learning也只能来自现成的范例 1 晨枫 字90 2016-02-18 10:08:52
🙂嗯,人工智能的标的物。。。不是人的智能 6 jent 字1048 2016-02-26 05:10:25
🙂人类智能的重要性并不只在于学习,还有破坏力 1 gy197666 字333 2016-02-25 20:00:52
🙂急智只有成功了才会被保留下来 四处张望 字21 2016-02-18 21:30:50