【读书会】《大数据时代》

舍恩伯格在《大数据时代》中分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。

大数据带来的一个巨大的颠覆在于,人们可以利用数据的相关性直接做出决策而不用拘泥于背后的原因。作者用沃尔玛来阐明了这个观点。沃尔玛利用自己的后台数据分析得到了很多有意思的结论,其中比较有名的一个啤酒和尿布摆在一起可以增加销量。对于这个现象我们还可以通过分析得出这符合男性的购物习惯,但是对于诸如“飓风的时候草莓味蛋挞卖得好”应该如何解释呢?没有人知道,我们也不需要知道,沃尔玛要做的仅仅是在飓风的时候增加草莓蛋挞的库存并且把它摆到显眼的位置就可以了。

利用大数据我们可以做出很多这样的精明决策,可是我们作为人的尊严与自由意志被挑战了。人类几千年进化而来,靠的就是对现象的总结和提炼得出规律。我们一直在靠因果关系来理解和审视世界,可是在大数据时代一切都变了,因果关系对于决策反而不重要了,换句话说,数据代替了人做决策,我们的发展在由数据推动而不是我们自身。如果一切都是经过数据分析做出的决断,那究竟是否还存在所谓的“自由意志”?或许我们早已经被数据统治,所谓的记忆不过是机器后台通过大数据分析给我们打造的幻象。书中作者也指出,“如果所有人都可以诉诸数据,那时人类无法预测性即直觉、冒险精神、意外和错误等,反倒可能发挥重大作用。”大数据可以帮我们更好的做决策,但即使在这种情况下,也不是每个人都能成为一个优秀的商人或是将军,因为在这些情况下,很多局势的改变并不是通过理性的数据分析,而是决策者的灵机一动或是拍案而起。说到底,大数据只能给我们提供一个无限精准的概率,未来仍旧掌握在我们手中,掌握在人类的冒险精神里。

作者更多的给我们介绍了大数据的运用和长处,但是随着思考的深入,不经会想到大数据的另一面。大数据的局限和限制在哪里? 一、大数据不懂社交。计算机数据分析擅长的是测量社会交往的“量”而非“质”。网络科学家可以测量出你在76%的时间里与6名同事的社交互动情况,但是他们不可能捕捉到你心底对于那些一年才见2次的儿时玩伴的感情,更不必说但丁对于仅有两面之缘的贝阿特丽斯的感情了。因此,在社交关系的决策中,不要愚蠢到放弃头脑中那台充满魔力的机器,而去相信你办工作上的那台机器。二、数据不懂背景。人类的决策不是离散的事件,而是镶嵌在时间序列和背景之中的。经过数百万年的演化,人脑已经变得善于处理这样的现实。人们擅长讲述交织了多重原因和多重背景的故事。数据分析则不懂得如何叙事,也不懂得思维的浮现过程。即便是一部普普通通的小说,数据分析也无法解释其中的思路。三、数据会制造出更大的障碍。随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。这种欺骗性会随着数据的增多而指数级地增长。在这个庞大的数据里,我们要找的有效内容被越埋越深。大数据时代的特征之一就是,“重大”发现的数量被数据扩张带来的噪音所淹没。四、数据偏爱潮流,忽视经典。当大量个体对某种文化产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。但是,一些重要的产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知,而被忽视掉的恰恰是经典。五、数据掩盖了价值观念。在《‘原始数据’只是一种修辞》一书中提到,数据从来都不可能是“原始”的,数据总是依照某人的倾向和价值观念而被构建出来的。数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。

并不是批评大数据不是一种伟大的理念。只是,和任何一种工具一样,大数据有拿手强项,也有不擅长的领域。这本书最有价值的地方不在于它对大数据的介绍和推崇,而是提醒我们数据是一种“资源”是一种非竞争性的资源,它的价值并不会因为被使用而减少,相反,它可能被通过不断地重复使用而产生出更高的价值。数据本身的价值,是它所有能够产生的可能选择的价值的总和。

本文来自投稿,不代表基层网立场,发布者:浩原,如若转载,请注明出处:https://www.jiceng.org/viewpoint/681.html

(3)
上一篇 2017-07-27 23:53:22
下一篇 2017-08-02 12:07:57

你可能感兴趣的

发表回复

登录后才能评论
投稿指南 网址导航
分享本页
返回顶部