读《大数据时代》有感
大数据这个词可以说是时下的热门词汇,一直听人提起但却不太了解它的真正含义,无意在图书馆看到这本书便拿来看了看。学术界上对于这本书的褒贬不一,在看翻译作者前言也指出他也不能认同这本书的全部观点。但就我而言,这本书作为大数据的入门书,还是值得一看的,书中的案例很多且都不深奥,读完这本书大数据在我心中也有了基本的雏形。
书中主要讲了关于大数据时代的三个观点,其中提到的最让我印象深刻的一个观点就是:不追求因果关系,转而追求相关性。即就是,不再探究为什么,而是直接告诉你是什么。一直以来,我们的思维都是因果思维,探求结果的时候总要分析理由,大数据时代就是改变了这种迂回的做法,直接探求相关性,减少了探究因果的成本。但我想这也是机器的思维,却不是人的思维,我们发展生存不就是为了探究理由吗?若是无意义的发展那还有什么意思,又会走向什么方向。我赞同追求相关性,但同时也需要因果性,利用相关性为因果性服务。
还有一个观点是:不是随机样本,而是所有数据。。这改变了我们以前的抽样调查的观念,也是从一个方面体现了大数据时代的“大”,是在说并不选取样本,而是选择所有数据。这依赖于现在技术的发展,计算机处理能力的发展,有条件去容纳所有数据。全体数据让一点小小的问题都无法逃脱人们的眼睛。
“不是精确性,而是混杂性”,不再追求数据的精准,而是承认它的混杂性,允许误差。这也是为了能够充分利用大部分的数据,尽管这些数据中可能存在误差,但是在大量混杂数据呈现的结果会比精确小数据的结果更好。
书中还讲到了关于大数据时代人们的隐私问题以及数据独裁的问题。大数据的确会造福我们的生活,但从另一个方面来说,我们也毫无隐私,甚至还可以利用数据预测我们之后的行为,如果利用不当大数据也可以毁了我们。数据若是大量集中在一方手中,也极容易发生数据独裁行为,大数据时代的发展也还是有一段路需要走。