《大数据时代》读后感
《大数据时代》读后感
这些年,我读了很多东西,但现在回想起来,发现自己似乎已经忘记了一切。实在是太悲惨了。都说读了万卷书,写得好像有思想,未必就对了。还是要勤奋写,所以我决定从这里开始。
这些年我没有跟上科技的发展。现在我发现即使在投资方面,科技也改变了我们的生活太多,而我又处于这股科技浪潮的最前沿,所以我还是需要跟上。
——序言
大数据的概念提了很久,我却一直疏于理解。读完《大数据时代》,结合自己在工作中对大数据的理解,我立刻发现了数据的重要性。以前我在这方面的思想认识还不够。
就全书而言,我认为最关键的三个点是前几章:
1、使用总体,而不是随机样本:从小到大学习统计相关的数据,基本上都是从样本开始的。其理论基础在于如何随机选择、充分分散的样本。这是技术技能和直觉的结合。对于大数据来说,需要的是人口。从本质上来说,总体样本确实可以更准确地找到结果。但对于统计来说,整体分析增加了数据分析的难度。不仅数据验证困难,而且一旦出现数据污染,准确性也会大大降低。而且,在进行数据回溯时,无法准确确认问题所在,这也是事后关联的问题;
2.混乱,不精确:这里的要点是希望数据的多样性,并尝试收集所有相关数据,无论是结构化的还是非结构化的。最终结果的不准确是不可避免的。大数据更多的是从整体数据中解释未来的概率事件。既然是概率,那就可以理解为不可能精确。这里有一点解释。我认为需要提到的是,大数据算法往往是“简单”而不是复杂。这出乎我的意料。
3.相关性,而不是因果性:从获取知识的过程来看,我不同意这个观点。从人体对知识的认识来看,我们还是要从因果论开始。没有因果论,我们就会变得盲目。在笔者看来,原因可能还是大数据本身的不准确。一旦找到合适的算法和相关性,就很难向上追溯原因。但从给出的例子来看,确认相关性是一个非常大的工程。基本上就是用排除法,一项一项去尝试。
因此,对于大数据来说,最重要的三点是:1、数据——获取更多的数据; 2、算法——建立了更快的算法体系; 3.思考——寻找数据之间更多的相关性。
至于数据的最终走向,我很同意书中提到的政府管理的观点。由于数据都是按照“石油”标准查看的,政府统一管理是必然的。而对于政府来说,拥有更多的数据也有利于其管理和维护社会稳定。至于社会道德的讨论,我不想多说什么。时代的发展不会被道德绑架。
所以最后,如果你想建立对大数据的思考,《大数据时代》还是值得一读的,而且里面的很多例子也非常好。比如人际关系方面就超出了我的预期。
本文由qingshulin发布,不代表倾述林立场,转载联系作者并注明出处:https://www.qingshulin.com/duhougan/show-550188.html
