西西河

主题:【原创】大数据与郑国渠 -- zw

共:💬44 🌺246 新:
全看分页树展 · 主题 跟帖
家园 大数据与死数据

大数据与死数据

为什么,在得知贵州还开办了大数据交易中心,也许是全球第一个

会觉得无比别扭??

连续发布了blog《大数据与郑国渠》、《大数据与黑天鹅》...

在blog中,笔者曾经提到:

积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

4月30日,一周后,黑天鹅又一次出现:《中国科学家难以获取高质量的国内数据科学》

外链出处

大数据是互联网、后资讯时代的产物。

而互联网的核心只有两个字:free(免费)+open(开放)

纽约的大学生,利用市政府的开放数据库,可以轻松制作出全市的犯罪热点分布图

而我们,就连专业科学家,都无法获得一手的数据,更何况商业应用了、BI开发。

也许,贵州的大数据交易中心,改为免费的、开源的数据共享中心,能够有一个华丽转身。

国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是:

::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。

有了成熟的理论体系,未必一定成功,没有,绝对是失败

::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。

一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。

大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放)

积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

中国科学家难以获取高质量的国内数据科学

http://www.solidot.org/story?sid=43883

上海海事大学的Zheng Wan在《自然》上发表文章称,中国科学家越来越难以获得高质量的国内数据,认为这一情况可能阻碍科研和创新。他说,大部分公共数据被政府部门控制,其中一些加强了对数据的垄断,使得中国研究人员难以获取这些数据。人文科学的研究人员受影响最大,但数据访问的限制正扩大到环境科学和公共健康等领域,原因是数据具有政治敏感性。即使数据公开了,其质量也令人担忧,最明显的一个例子是全国的GDP数据和各省公布的GDP数据之间存在显著差距,国家统计局称数据差异是数据收集方法的不同导致的。在文章最后,Zheng Wan谈论了互联网审查,称Google学术搜索被屏蔽对他的工作影响非常大。

通宝推:舞动人生,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河