西西河

主题:【原创】抛砖!模式识别和机器学习、数据挖掘的区别与联系 -- 永远的幻想

共:💬65 🌺337 新:
全看分页树展 · 主题 跟帖
家园 (六)对几本经典著作的评注2

这次先贴两本离题稍远点的,作为开阔知识来用的参考书。

《Artificial Intelligence:A Modern Approach》

中文版

点看全图

外链图片需谨慎,可能会被源头改

影印版1(人邮)

点看全图

外链图片需谨慎,可能会被源头改

影印版2(清华)

点看全图

外链图片需谨慎,可能会被源头改

英文原版

点看全图

外链图片需谨慎,可能会被源头改

中文 和2种影印都是原书第2版,02年出的,两种影印我比较过内容没区别,但是清华的纸质稍好,但价格贵好多。

中文和人邮的影印图书馆好找,但是市面上好像木有了。

现在原版是09年底刚出的第3版了。但看书评,好像变化不是特别大,有些有第2版的人觉得亏了。

优点:

1.涉及面特别广。从走棋的算法,到语义逻辑分析,到智能系统……并不局限于概率统计类的方法,无所不包。

2.很多AI方面的历史人物和典故。从莱布尼茨时代的机械计算机器,到图灵,到50 60年代某人第一次写了个啥算法。怎么说呢,当故事书看也行了。

3. 叙述比较清楚。

问题:

1. 有点散。各个章节之间有时联系不是那么大,其实为了做到包罗万象,散是难免的。

2. Introduction 而非 Reference。所以指望看这个书完了去照着写算法,就别想了。

3.第2版里没涉及支持向量机(Support Vetor Machine SVM)。这个即使作为02年出的书也不应该了。不过现在SVM基本是大路货了,到处都是(SVM有点走当年神经网络最后烂大街,无人问津的趋势)。

4.太厚,快速翻阅即可。中文700多页,英文1100多页。因为毕竟大家有各自专业背景,所以挑前几章+自己相关领域的章节,浏览即可,其他当故事书看,就当做专业英语的阅读资料吧。

总之,适合没接触过的这方面的人入门用。但是个人感觉一个是有点散,一个是概念太多,没有突出概率统计。感觉很容易迷路似的,所以第一本没推荐这个。但N多学校都用这个做教材,不是没道理的。

《Nonlinear Time Series: Nonparametric and Parametric Methods》

中文版

点看全图

外链图片需谨慎,可能会被源头改

影印版

点看全图

外链图片需谨慎,可能会被源头改

英文原版

点看全图

外链图片需谨慎,可能会被源头改

这本两个中国牛人写的。范剑青姚奇伟

这本虽然专讲时间序列,但是觉得自动化之类工科出身的人往机器学习数据挖掘方面转的话,这样一本由数学家写的数学味浓一些的书还是很有必要的。特别是中国人写的,所以在大牛在国内的时候,还有机会当面请教。

优点:

1.背景知识适合自动化、通信这些专业的。一般电子类的都会学点现代数字信号处理比如Wiener最佳滤波,Kalman滤波之类,已经了解ARMA模型了,这样看这个书可以了解这些方法的发展和引申。虽然不见得以后真的去做金融之类,但是用自己熟悉的背景知识去入门,总比两眼一抹黑钻进去强。其实“在工言工”,看成是在讲高级滤波算法的话,能不能用在控制系统里呢?反正俺那本已经被搞控制的同学借去鸟。

2.图表例子多,程序提供下载。虽然是S-plus/R写的,可能工科的没接触过R,但是很容易上手。

3.数学味,不解释。

问题:

1.领域比较专门。主要适合经济数据,金融数据这些。当然书里也举了生态学上的例子。

2.比较难懂。一个是数学味,一个是很少分析算法细节,公式推导都比较简略,要配合参考文献和程序。

但是之所以推荐这本,倒不是说里面讲到的那些方法。而是想:

1.介绍两位中国牛人,有机会见到可以请教

2.通过这书里的例子,了解点R语言。开源的数学软件,是数学家用的,上面有很多最新的ML算法。假如你早已熟悉了工程味的MATLAB,现在可以体味一下R简化的都是哪些地方?在思路和实践上,都要习惯不断切换工科和理科两种方式。试试理科的工具,也就能多找找感觉。

3.要适应数学家的表达。毕竟这个领域的算法都是人家提出来的,看论文基本就是在膜拜统计学家了。通过这个也体会一下同样是ARMA模型,理科是怎么思考的。不要再满足于当初学信号处理的时候,好像学了个Levinson-Durbin,Kalman递推公式就万事大吉。

元宝推荐:游识猷,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河