《大数据时代:生活、工作与思维的大变革》
什么是大数据?大数据对于我们来说又有什么样的意义?大数据看表面的意思就是只是巨量的数据,实际的意义是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据对于我们来讲是有很大的意义的,比如书上的例子,谷歌公司预测冬季流感传播,不仅是全美范围,而且可以预测到特定的地区和州。它令公共卫生官员们和计算机科学家们感到震惊。为什么谷歌公司能够预测呢?谷歌保存了多年来的所有搜索记录,每天都会收到全球30亿的搜索指令,而且唯一关注的是特定检索词条的是使用频率与流感在时间和空间传播上的联系。而且比疾控中心更快。这是建立在大数据之上的,通过对数据进行分析,得出巨大价值。
现如今技术发展的飞快,互联网越来越发达,数据也越来越多,许多大数据公司应运而生,中国也有许多大数据公司,像阿里巴巴、腾讯等等一些公司,像阿里巴巴的淘宝里面的“猜你喜欢”那一栏,根据你收藏、浏览、购物车还有购买过的物品里和淘宝店里的物品相匹配,分析出你可能会喜欢或者浏览甚至于可能会购买的物品。这就是大数据的应用,对于各行各业来说大数据有不同的功效,现在的手机电脑成了人们离不开的随身物品,一秒钟内可能就有无数人发消息,上搜索引擎,这是一个巨量的数据,以前的老计算机可能会花些时间来处理这些数据,现在的数据分析系统可能在几秒钟之内就完成了处理。回归到《大数据》这本书上来说,作为一个文科生,听到这个名字就觉得晦涩难懂,但实际翻开会发现很有趣,书中的例子相当多,几乎每页都会有例子出现,那种专业的偏理工的名字出现的相对较少,让人很容易懂,全书分了三个部分大数据时代的思维、商业、管理变革,每一个又分了小点来陈述。译者周涛说:“希望大数据时代给予各位的是一些实实在在的知识和思考,并且唤起各位安庆思索相关问题的心境。大数据是一个很重要的概念,代表了很重要的趋势,但我不希望它成为一种放之四海皆准的万能概念——因为越是万能的,就越是空洞的。”的确,现在我们的行为模式就是照搬百度、谷歌等搜索引擎给的答案,僵化的复制粘贴,永远理解不了答案所表达的含义。现在快节奏的生活让我们的节奏加快,没有多少时间真正安静下来去思考,答案千篇一律,很少有自己思考的痕迹,而我们复制粘贴的答案也越发的空洞,缺少实质性的内容,答案的出现不是为了让我们更好地去理解给出的问题,丰富我们的知识。大数据时代确实能让人静下心来去思考,作者在序中也说他对于这本书上的一些观点也不是很赞同,这本书绝对可读,但并不是绝对真理。书中有一个观点我觉得很赞同,就是第二章“不是精确性,而是混杂性。”大数据下的计算也不能达到100%的准确,要接受它的容错率,才能更好的利用那些非结构化的数据。放宽了容错的标准,可利用的数据空间更多,就可以创造新的事物。“这样就不是大量数据优于少量数据那么简单了,而是大量数据创造了更好的结果。”大数据在无限制的增长。混乱也是必不可少的,为了少量数据的精确性,把数据越缩越小,错误率也在不断地增加,或者格式的不一致性,在大数据的背景下,清洗数据确实要难得多。大数据下的精确性是通过各种数据的不断融合、分析,用的是概率,就像之前说过的谷歌预测流感,它是通过分析搜索词条的使用频率以及流感在时间和空间传播上的联系。哪个地区开始传播,那个地区用户搜索词条使用频率增加,通过一个大概率的算法,加上之前流感传播的数据,得到相对精确的结果。
大数据在各行各业方方面面都发挥出它的作用,而维克托的这本书告诉我们如果更加拓展,物尽其用,而且他有很超前的想法,让我们在大数据时代如何转变我们的思维,提高它的商业价值等等,大数据未开发的部分远远比开发的部分巨大的多,但我们如何从这些数据中找到更多新的、更有价值,可使用的东西。就像人类学家克利福德•吉尔兹说的:努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。