西西河

主题:【原创】云里雾里的云计算 [1] -- 邓侃

共:💬620 🌺1262 新:
全看分页树展 · 主题 跟帖
家园 几个方向,包括自然语言理解技术,结构化知识发现等也许

是解决办法。

其实用关键字在互联网信息量在一定限度之下时还是很有效的,但是信息量越来越大就有问题了。

不如,用“主板”做关键字Google就无法判断你到底是要找电脑的主板信息还是证券的主板信息。

现在用了多关键字,但是多关键字也会遇到信息越来越多,一些小众的信息会淹没在大众的信息之中的问题。

从这个方面考虑自然语言理解技术是改进方向之一,但是这条路困难重重,曙光还比较遥远。

另外一个方面就是结构化知识,就是发现信息之间的内在关联,可以更准确的处理、检索信息。但是这个方向对于前面说的知识爆炸问题还是无法解决。

最后一个办法就是,让Google知道你的偏好,比如你是个IT工程师,那么你检索“主板”八成是找电脑主板,另外如果你多次检索华硕的T2P4,那么以后你再检索T2P4的时候,Google可以针对性的把更新升级信息都推送出来。这个也许就是终极解决办法。

(纪念下我的第一块主板ASUS T2P4)

如果这个办法由于法律的原因无法实施,那么云计算在一定范围之内也许可以达到类似的效果,比如某企业的员工利用企业的云检索相关信息,那么显然Google对该用户可能的检索范围会有更多的理解。

另外以方面,企业用Google的云建立信息,也会有利于Google更好理解企业发布的信息,便于形成所谓的结构化知识。 这方面从Amazon的云和Google的云的区别上也许可以看出倪端。

Amazon的云就是一个纯的Linux虚拟机,你可以有Root权限,并且做任何你想要做的事情。

Google的应用引擎(App Engine)实际上是一个Linux运行环境,但是没有写文件的权限,如果你想保存数据,必须使用谷歌的数据库。而且实事上你必须用Python环境来实现Web应用,用Google的数据库做任何储存。这也许反应了Google对数据的野心。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河