主题：【围观】Alphago zero的第一盘棋和后来 -- PBS

共:💬24 🌺40 🌵2 新:

老大河待整

监督学习和增强学习是不一样的

你这些数据，包括了医生诊断的结果，是以人给出的结果作为基准进行学习，所以这是监督学习

而如果去掉了这些医生诊断的结果，让AI对着各种原始数据慢慢想，这就是非监督学习，可想而知这条路没那么好走

同样不依赖人类专家的结果，而是明确定义出什么样的学习是进步什么样的算退步，这就叫增强学习，也就是AlphaGo Zero的方法核心。这样的学习，不需要人类的目标数据，但是需要规则去定义进步和退步，才能有训练算法所必需的损失函数这些东西。这样的规则现实中大多数时候是没有的，所以增强学习目前多用在游戏，还是规则比较简单明确的游戏，星际争霸这样复杂的现在都不行

至于医疗诊断方面的监督学习，思路还是比较简单的，而难点一是海量人类专家数据的积累和处理，二是对极复杂算法结构的硬件支持。这些事情已经好多人在做了，比拼的是时间和运算力的消耗

全看分页树展 · 主题跟帖

相关回复上下关系6
压缩 6 层
- - 🙂靠谱程度、应用模式呗 epimetheus 字1408 2017-11-02 08:52:08
    🙂我能想到的就是责任不知字237 2017-11-02 04:09:15
- 🙂AI在医学影像诊断上创新出新规则是可能的。。菜根谭字847 2017-10-23 09:59:50
  - 🙂监督学习和增强学习是不一样的
    🙂实际上那些存在的档案中也有很大一部分是错误的天天跑路字146 2017-10-25 03:35:21
  - 🙂医学应用的难点可能在于缺乏足够的实验样本 1 搜火字507 2017-10-23 11:02:37

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明