服务热线:028-8556-4969
语言:中文
您当前的位置:首页 >作品交易> 文字作品> 其他>

大数据时代

作者:贾梓齐
主要内容     

《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。

作者提出了关于大数据的“掷地有声”的三个原则。这三个原则凡讲大数据必被提及,很多人奉为圭臬。但是我觉得每一点都值得探讨。这三点分别是:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。

1.不是随机样本,而是全体数据

作者认为人类之前主要受限于数据的处理能力而不去处理全量数据,但在目前机器处理能力有了巨大的提升的时代,限制绝大多数应用的瓶颈不是计算能力而是数据采集能力比如人口普查,无论计算机力量如何强大,当前很多数据还是要人工去收集,所以这个普查还是要用抽样的方式。有意思的是,作者用人口普查是抽样分析来说明非“全量”时代我们被迫采用了抽样,而最终也没法说我们是否已经可以用全量数据来做人口普查了。实际上至少在目前,对于人口普查,抽样还是必然的选择。现在呢,还是必须依赖抽样。仅从逻辑而言:收集、处理数据的行为本身也在不断产生着新的数据。有时指“我们需要的所有数据”,有时指“我们能收集到的所有数据”。作者举了人口普查的例子,我们有能力处理越来越多的、在以前不敢想象的大量数据。

2.不是精确性,而是混杂性

在使用抽样数据的时候,我们就知道要容忍一定的误差。我们甚至知道在就算取得了“全样”数据的时候,也可能因为有各种原因而导致的不精确,统计实践中对此有相当多的案例。

3.不是因果关系,而是相关关系这是很多人认为最有价值、最重大的发现。计算机能够提供给我们的结论都是相关性。计算机从未提供过明确的因果关系给人类。通过大量的数据分析,慈善组织得出结论:一个国家、地区的电视机的普及率与发达富裕程度很有关系,于是他们就向贫困国家赠送了很多电视,认为此举可以促进改过的经济发展。书中举了一个例子:谷歌通过关键字来确定哪里可能发生了流行病。

针对未来可能出现的危机,舍恩伯格还给出了具有建设性的应对之道——看了他的个人履历后,你不得不佩服这样一位在技术和公共政策都具有独到见地的跨领域专家。

原创不易,您可选择 , 鼓励原创呦!

联系我们
地址:四川省成都市武侯区浆洗街27号天亿大厦A座1107室
电话:028-8556-4969
邮箱:xzb@goldcopyright.com 联系我们
扫一扫
登录移动端
如您有以下需求请勾选或填写相关信息,我们将尽快与您联系
1.有意购买本作品并询价
2.单次使用本作品并询价、授权
3.委托本作品的作者定制业务并询价
4.其他