西西河

主题:【原创】机器学习的基础是什么?(0) -- 看树的老鼠

共:💬154 🌺509 🌵1 新:
全看分页树展 · 主题 跟帖
家园 很简单的测试

我们用“传统”统计学习算法做了数据中心服务器异常检测。一天分成24个小时,每个小时一个模型学习服务器的用量。用量大大高于或低于平时就是异常。实用中这机器学习基本达标。前提或缺点是事先要了解服务器用量的pattern,确定一天分成24个模型。

看到nupic(Grok开源的算法)我想nupic能否根据数据机器自己建模。初步测试的结果不令人满意。nupic自带一些例子。其中一个hotgym的例子跟我的use case很像。这hotgym的例子是预测健身房的用电量。健身房的用电白天高,半夜很低,但不会降到0。 降到0意味健身房断电,属异常。我把hotgym例子中一些半夜用电量设成0. Nupic没能检测出异常。

我想如把一天时间分成24段给Nupic。它可能会检测出异常。但这前提是了解用电量的pattern,这与我现有的算法比就没有本质的优越性了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河