西西河

主题:【围观】Alphago zero的第一盘棋和后来 -- PBS

共:💬24 🌺40 🌵2 新:
全看分页树展 · 主题 跟帖
家园 监督学习和增强学习是不一样的

你这些数据,包括了医生诊断的结果,是以人给出的结果作为基准进行学习,所以这是监督学习

而如果去掉了这些医生诊断的结果,让AI对着各种原始数据慢慢想,这就是非监督学习,可想而知这条路没那么好走

同样不依赖人类专家的结果,而是明确定义出什么样的学习是进步什么样的算退步,这就叫增强学习,也就是AlphaGo Zero的方法核心。这样的学习,不需要人类的目标数据,但是需要规则去定义进步和退步,才能有训练算法所必需的损失函数这些东西。这样的规则现实中大多数时候是没有的,所以增强学习目前多用在游戏,还是规则比较简单明确的游戏,星际争霸这样复杂的现在都不行

至于医疗诊断方面的监督学习,思路还是比较简单的,而难点一是海量人类专家数据的积累和处理,二是对极复杂算法结构的硬件支持。这些事情已经好多人在做了,比拼的是时间和运算力的消耗

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河