当前位置:红颜文学网 > 作文 > 正文

《简单统计学》读后感精选10篇 生活中的统计学小例子

导语:《简单统计学》是一本由 加里·史密斯着作,后浪丨江西人民出版社出版的平装图书,本书定价:58.00元,页数:376,本站小编精心整理的一些读者的读后感,希望对大家能有帮助。《简单统计学》读后感:全书内容的思维导图《简单统计

《简单统计学》是一本由 加里·史密斯着作,后浪丨江西人民出版社出版的平装图书,本书定价:58.00元,页数:376,本站小编精心整理的一些读者的读后感,希望对大家能有帮助。

《简单统计学》读后感:全书内容的思维导图

《简单统计学》

人类由于两种倾向而导致认知错误: 1容易被模式、解释模式的理论所引诱。 2总有寻找支持假设的证据而忽视或曲解与假设相反的证据的倾向。

纠正这两种倾向所引起的认知错误之方法: 1常识。不寻常的说法应该有压倒性的证据支持。 2新数据。在旧数据已经支持理论的时候,再用旧数据不会有突破,应使用新数据来进行检验。

几种最常见最重要的谬误: 1幸存者偏差 2自选择偏差 3证实偏差 4安慰剂效应 5相关还是因果? 6“德克萨斯神枪手”谬误

本书缺点: 1“证实偏差”是谬误之父,其他大部分谬误都肇始于此,作者在书中未给予与之相称的重视或强调。 2分类有重复,有些相近的谬误在章节分布中距离远。 3对“常识”过于推崇,容易得到“凭借常识就可以包打天下”的想法。事实上现代心理学的大部分结论都是反常识的,但依然是科学。我们的常识也不可靠。

《简单统计学》读后感:被体检结果吓得半死,只因为不懂统计学

前段时间单位组织体检,体检报告出来之后把我吓得不轻:居然有一项癌症筛查指标偏高!一阵恐慌之后,发现居然好几个同事这项指标偏高。难道一个公司这么多人得癌症?是不是医院搞错了呢?果然,我们去复查之后,指标又正常了,医生表示没有任何问题。确定自己没得癌症,悬着的心放了下来,但还是有点郁闷:医院的检测也太不靠谱了吧?

不过,最近我在读《简单统计学:如何轻松识破一本正经的胡说八道》一书的时候发现:不是医院不靠谱,是我不懂统计学。

这话怎么说呢?先让我们一起来玩个小测试:假设某病的发病率为0.1%,而针对这个病的检测手段准确率是99%。现在小王去医院体检,检查结果为阳性,也就是“有病”。问题来了,小王真“有病”的几率有多大?

在往下看之前,建议你先在心里估算一个数字。

正确答案是:9.0146%。是不是很吃惊?别急,我们一起来分析一下:

现在假设有10万人去医院做检测,其中100人是病人,检测结果是这样的:

第一行:有100个是病人,其中99个检测出阳性,准确率99%,这个没问题。

第二行:有99900个是健康人,其中有999个被检测出呈阳性,准确率99%,这个也没问题。

关键点在第一列里面:在所有1098个检测呈阳性的人中,有999个是健康人,99个是病人,也就是说,如果小王被检测出阳性,他真的是病人的几率是99÷1098*100%≈9.0164%。

如果把这个问题改一下:小王的检测结果是阴性,他是健康人的几率是多大呢?答案是99.999%。

你看,如果检查结果显示小王没病,小王极有可能是真的没病;如果检查结果显示小王有病,小王极有可能还是没病。

上面这个分析方法是我在《简单统计学:如何轻松识破一本正经的胡说八道》一书中学到的,其中第6章关于大麻检测的案例就是用的这个方法。你也可以试着自己玩一下这个游戏,改变一下发病率和检测的准确率,你会得到很多有趣的结果。

不夸张地说,《简单统计学:如何轻松识破一本正经的胡说八道》这本书彻底改变了我对统计学“高深莫测”的印象。书中通过丰富的案例,深入浅出地解析了大量由于不懂统计学造成的认知错误,小到买彩票,大到国家政策的制定,每一个都让人拍案叫绝。

这本书的作者加里·史密斯曾在耶鲁大学任教7年,他的统计学课程非常接地气,跟日常生活紧密相关,在耶鲁大学特别受欢迎。他的书也延续了课堂的风格:没有让人望而生畏的数学和图表,只有有趣的案例和深入浅出的解析,即便是从没接触过统计学的读者,也可以轻松愉快的读完这本书,并从中收获真知灼见。

本书的英文版已经引起了广泛关注,连诺贝尔经济学奖得主罗伯特·希勒都大加赞赏:“这是本非常有趣的书,却揭示了非常严重的问题。”

为什么罗伯特希勒说这本书“揭示了非常严重的问题”呢?

实际上,统计学已经席卷了几乎所有的科学领域,从医学到物理,从经济学到心理学,没有哪个学科能在不使用统计学方法的情况下开展科学研究。问题在于,统计学是一门关于数据处理的科学,而人类的大脑生来并不擅长处理数据。即便那些最聪明的人,也会因为不懂统计学或错用统计学而闹笑话,甚至引起灾难性的后果。

1、超级畅销书错在哪里?

在一本超级畅销书《从优秀到卓越》中,吉姆·柯林斯及其团队花了5年时间,考察了1435家公司40年的历史,发现了股价表现优于平均水平的11家公司,并对这些公司进行了详细研究。他们发现了这些公司的一些共同特点。柯林斯认为,“只要认真使用我们发现的思想框架,几乎任何组织都可以极大提高自身的境界和表现,甚至成为一家卓越的组织”。

柯林斯说的对吗?我以前读这本书的时候,真的没发现有什么不妥。但是加里·史密斯在《简单统计学:如何轻松识破一本正经的胡说八道》一书中指出了其中的严重错误:这是一项存在幸存者偏差的回溯性研究。

如果你不知道什么是幸存者偏差和回溯性研究,没关系,你只要思考以下这个简单的问题:“所有妈妈都是女人”,是否意味着“所有女人都是妈妈”?

显然,不是。

那么,“全部11家伟大公司都具有某些特点”,是否意味着“具有这些特点的都是伟大公司”?

显然,也不是。

现在,你已经知道问题出在哪里了。

根据事后的结果去做“预测”是不对的,因为你研究的是“幸存者”,还有很多符合标准却已经倒闭的“非幸存者”,都被遗漏了。从所有公司中选出表现最优的11家,再去制定符合这11家公司的标准,无异于一个毫无射击技能的人对着墙狂射一气,然后在弹孔最密集的地方画上靶心。使用这种方法,人人都能成为神枪手。

其实研究企业的成功和研究个人的成功,本质上是一样的。网络上流传的“成功人士都具有这些特点”的文章,总是能让人趋之若鹜,其隐含的意思无非就是“只要你也具备这样的特点,就能成功”。但是是学了统计学,你可以淡定地反问一句,有这些特点的都是成功人士吗?

很可能,这些成功人士都只是“幸存者”而已。

2、造成数百万人失业的经济学研究

错信了畅销书的后果还不算最严重的,错误的研究导致错误的政府决策,才是真正的灾难。

2010年,两位哈佛教授卡门·莱茵哈特和肯·罗戈夫发表了一篇论文,认为当联邦政府债务相对于国内生产总值的比例超过90%时,国家的经济增长就会受到拖累。

过高的债务率会拖累经济,这听上去似乎很合理。确实,人们接受了这两位哈佛教授的观点。虽然许多经济学家不同意这个观点,但是他们都没有找出严重的错误。一些欧洲政府也接受了这样的观点,试图通过削减开支和提高税收来减少财政赤字。

欧洲的紧缩政策带来的后果是灾难性的:欧洲平均失业率从2011年的10%,上升到2012年的11%,再上升到2013年的12%。失业率每年增加1%意味着什么呢?考虑到欧洲超过7亿的人口基数,1%的失业率意味着每年有超过700万人失业!可见,这一政策造成的经济损失是无法估量的。

那两位哈佛教授关于“90%债务临界点”的研究到底出了什么问题呢?2012年,马萨诸塞大学安姆斯特分校的一名研究生托马斯·赫恩登和他的两名指导教授对原始数据进行了研究,发现了问题所在:两位哈佛教授对数据进行了人为的筛选,使之符合他们的理论!

他们有时排除了某些国家的数据,有时排除了某些年份的数据,有时使用了不同寻常、前后矛盾的计算方法,但是这些“调整”没有任何合理的原因。唯一的解释是:这些“调整”使得计算出来的增长率为负数,以符合他们的理论。

根据赫恩登和他的指导教授的重新计算,如果不做任何“调整”,计算出来的增长率是正的,也就是说,结论跟两位哈佛教授完全相反。

可惜,发现得太晚了。

3、普通人能从统计学里学到什么

如果你觉得前面的案例都太“高大上”,不如看看下面这个小例子。

你买双色球彩票时,会不会买“1,2,3,4,5+6”这样的组合?相信几乎没人会这样买,因为人人都知道,这个概率太低了!不过你别忘了,任何一个组合出现的概率,其实是一样的。

下次产生买彩票的冲动时,不如提醒一下自己,你想买的那注彩票,中奖概率跟“1,2,3,4,5+6”一样大。或者说,一样小。

读这本《简单统计学:如何轻松识破一本正经的胡说八道》,我有两个感想。

第一个感想是:每个人都该学点简单统计学,因为统计学实在太有用了。

第二个感想是:人类实在太容易犯错了,哪怕是那些最聪明的人也在劫难逃。还是苏格拉底说得对啊,世界上最有智慧的人,恰恰是知道自己无知的那个人。

《简单统计学》读后感:假如数据欺骗了你

文/黄老邪

“每天饮用两杯咖啡,患上胰腺癌的风险将极度放大”“生活在输电线附近的儿童具有更大的患癌风险”“如果一个人的姓名首字母缩写拥有积极的含义,那么他的可以多活三到五年”

看到上面几个论断,大家的第一印象是什么。是质疑,是相信,还是陷入深思?如果我告诉你,这几个结论都是国外着名经济学家、统计学家,通过数十年实验数据的研究而总结出来的成果,你又会做何感想?

我们生活在一个信息爆炸的时代,而信息的本质其实是数据。面对这海量的数据,很多专家学者可以借助各种成熟而先进的分析工具,从这些真实的数据里面给我们抽取出大量荒诞不羁但又似乎无懈可击的结果,这又该如何破解?

前面那三条论断来自一本书,书的名字叫《简单统计学:如何轻松识破一本正经的胡说八道》。

作者是美国作家加里.史密斯。他是耶鲁大学博士,曾在耶鲁大学任教7年,两度获得教学奖。他的课程因为结合日常生活中的常见实例、深入浅出的分析数据而异常火爆。

《简单统计学》洋洋洒洒26余万字,共分成19个章节。全书通过数十个生动有趣、真实鲜活的案例,给我们一层层揭开数据背后的骗局。

我用三个部分给大家阐述这本书的主要内容。

第一部分:数据是如何欺骗我们的

可以从客观跟主观两方面来分析。

客观方面

1、 混杂因素

混杂因素是指在试验中,能够混淆所研究因素与结果之间联系的那些外部因素。它的存在会对试验结果产生干扰,即出现所谓混杂效应。

说个例子,在2008年欧洲杯和2010年世界杯两届大赛中,有一样生物火了起来,那就是章鱼保罗。它预测14次猜对13次、成功率高达至92.85%,堪称不折不扣的“章鱼帝”。

用常识来看,有预言能力的章鱼是不可接受的。那底层的原理是什么呢?是混杂因素。这里的混杂因素很不容易被大家识破,它是国家国旗的样式。

因为预测的方法是通过在鱼缸旁边放置两个国家的国旗跟食物来让章鱼进行选择。研究发现,章鱼这类生物能够识别明暗度,尤其喜欢横向条纹。而保罗在这么多次的预测中一共只选择了三个国家,分别是德国、西班牙跟塞尔维亚,大家来看下这三个国家的国旗就明白了。原来并不是保罗真的能够预测比赛的结果,它只不过选择了自己喜欢的国旗。

2、 幸存者偏差

书中提到一个例子,二战期间,英国皇家空军计划在飞机上安装厚钢板,以帮助它们抵抗德国战斗机和陆基高射炮的攻击。他们调查并收集了飞机上子弹孔的位置,发现大部分都位于机翼和飞机尾部,而在驾驶舱、发动机和油箱的位置则非常少。于是决定把钢板装在机翼跟飞机尾部。

这个结论是错误的,因为它使用的数据全部基于在战斗中成功返回的飞机,那些在驾驶舱、发动机、油箱等位置被击中的飞机全部都无法存活下来。这就是数据的"幸存者偏差"造成的错误结论。

3、 视觉误差

看下面两个图。

这是某公司连续七个季度的收入曲线。这两幅图采用的数据完全一样,可是从视觉上来看,第二张图会让读者产生误导,公司的收入在后两个季度急剧下降!实际上从第一张图可以看到,这个公司的收入水平其实是很稳定的。

这是怎么回事呢?

细心的读者或许已经注意到了,这两张图纵坐设置的不一样,第二张图重新确定了“零点”,于是便放大了波动。

在PPT领域有一句很经典的话:能用图的不用表,能用表的不用字。确实,图像可以帮助我们解释数据,做出推断,获得直观效果。但图像可能会有意无意的扭曲或破坏数据。

《简单统计学》里展示了大量充满误导性的图片,有些甚至是国家权威机构在历史中曾经屡用不爽的,大家不妨去看一看,顺便测试下自己的分辨能力。

主观方面

数据能够欺骗我们,除了上面提到的客观因素,其实主观因素也占据了至关重要的地位。作者加里.史密斯从生物学角度出发,他指出:

人类在漫长的进化岁月中,产生了寻找模式并对其做出解释的内在倾向。

就是说,我们很容易被某种模式以及解释模式的理论所引诱,因此我们常常关注支持这种理论的数据,而有意或无意的忽视与之相矛盾的数据。这就是所谓的“自选择偏差”。正是因为很多人在数据处理或者识别的过程中有意无意的引入了“选择偏差”,进而导致这些被“筛选”过的数据推导出让人几乎不可反驳的错误结论。

第二部分:是谁在欺骗我们

《简单统计学》里提到了很多在日常生活中我们被数据欺骗的例子,而欺骗的发起者可能是经济分析师,股票专家,甚至是政府机关,他们会出于各种利益角度,通过截取有限数据的方式进行经验总结,并通过向公众传达这种经验论断而获得收益。

值得一提的是,《简单统计学》中作者直言不讳的对很多知名的学者进行了批评。比如说超级畅销书《魔鬼经济学》的作者史蒂芬.都伯纳。书中说,这位作者

过于擅长并炫耀自己在“从数据到结果”这个过程的梳理技能。这将导致他愿意为了满足自己的理论而刻意去搜刮合适的数据,这是非常危险的一种做法。

不独史蒂芬,很多知名的物理学家,数学家,他们同样会在自己的着作中采用一些数据处理上的“伎俩”来欺骗读者。这是因为他们要出版自己的图书,发表自己的论文,提出自己的原创理论,而为了保证理论的完备性,他们便会有意的舍弃不符合理论的数据。

这一点很值得我们普通人警惕,我们平时接触到的各种信息、数据、论断,即使它们出自权威的着作与机构,其真实性也有待检验。

第三部分:在充满了欺骗性的数据面前,我们应该怎么做

《简单统计学》中提到的应对策略总结下就是:常识判断+新数据检验+质疑的精神。

常识判断

很多看起来严谨但不太符合我们平时所接受的数据或论断,往往用常识就可以识别出来。需要强调的是,这里的常识不仅仅是指普通人几乎都具备的跟生活相关的那些通用知识,更本质上是一些较为基础的经济学跟数理统计的知识。

新数据检验

《简单统计学》中反复强调数据跟理论的关系。我们可能被缺少数据的理论欺骗,正如我们可能被缺乏理论的数据欺骗。而对理论进行检验的最好办法就是引入新数据。比如本书的作者就给一个颇有名气的股票分析师寄去了三张图。而那位分析师从图中呈现的数据给出了坚定的股票购买论断。但实际情况是作者寄过去的其实是他的学生完成的硬币抛掷的统计结果。

质疑

巴尔扎克说:打开一切科学的钥匙毫无异议的是问号。面对权威,面对真实的数据,面对看似严谨的理论,我们都需要并且敢于质疑。比如说《简单统计学》这本书,我在阅读的过程中,把书中所有能够计算的数据全部复核了一遍,并且在Excel里用RAND、COUNT、IF等几个简单的函数完成了200余次的硬币抛掷的模拟实验,很有意思。

鉴于篇幅,无法对《简单统计学》一书的内容完全进行阐述,书中还有大量有趣、实用、精妙的案例跟分析,譬如“统计的显着性”、“小概率事件”、“博傻理论”、“辛普森悖论”、“胜者诅咒”等等,全都非常精彩,推荐你去阅读。

随着互联网的迅猛发展,我们进入了数字时代。习总书记在12月8日的中央政治局集体学习中专门论述了大数据时代数据对于我们的重要性,并指出,在这个时代,我们要“善于获取数据、分析数据、运用数据”。

有幸身处这一关键历史潮流之中的我们,面对错乱纷杂的海量数据,更要学会练造一双慧眼,将这数据看得清清楚楚,明明白白,真真切切。

诸君努力!

—The End—

《简单统计学》读后感:假如你对数据拷打足够长的时间,它一定会招供

本书的作者是耶鲁大学博士,曾在耶鲁大学任教7年,其间再度获得教学奖,他的课程因结合日常生活中的常见实例,深入浅出地分析数据而火爆异常。 ——书页作者介绍书里的案例极为丰富,一个一个小故事读起来不忍释卷。下面举几个有趣的例子: 1 飞机的哪些部位需要保护?

“逃到美国的匈牙利犹太人亚伯拉罕·瓦尔德敏锐地意识到,这些数据存在幸存者偏差。返航飞机的驾驶舱和油箱之所以很少出现弹孔,是因为这些部位被击中的飞机无法存活下来并返回英国。返航飞机在机翼上出现弹孔的可能性更大,因为这些弹孔的伤害很小。瓦尔德的建议与最初的结论完全相反:他们应当加固没有弹孔的位置,而不是弹孔最多的位置。 ”这个办法发挥了作用。被击落的飞机数量大幅减少,安全返航并且可以重新投入战斗的飞机数量大幅增加。”

2 变形的图

所采用数据完全相同,图像走势大不相同,差别在哪?

“图5.1和图5.2使用了完全相同的数据。不过,图5.1的纵轴包含零点,图5.2的纵轴则不包含零点。图5.1掩盖了数据中的任何模式,我们无法判断利润达到峰值的时间。另一方面,图5.1正确地向我们传达了'最近的下探很轻微'这一信息。 "图5.2忽略了零点,放大了数据的波动性,使我们能够发现原本非常模糊的变化。不过,当零点被忽略时,图像将不再准确指示变化的量级。要想知道变化幅度,我们需要查看具体数据。图5.2的曲线高度下降了40%,但实际收入只下降了2%。”

3 达特茅斯三文鱼研究 “下面是实验报告的一部分: “对象:参与功能磁共振成像研究的一条成熟的大西洋三文鱼。这条三文鱼长约45厘米,重约1.7公斤,在扫描时处于无生命状态。 “任务:对相关三文鱼执行的任务包括完成一个需要动用大脑的开放式任务。实验向三文鱼展示了一系列照片,照片上描述了社会情境中具有特定情绪效价的人类个体。实验要求三文鱼确定照片中的个体正在经历的情绪 “设计:刺激以区组设计的形式呈现,每张照片展示10秒,然后休息12秒。共有15张照片得到展示。总扫描时间为5.5分钟。 “分析:实验用一般线性模型的普通最小二乘估计对三文鱼立体像素数据进行了处理,用方脉冲函数与标准血液动力反应的卷积模拟血液动力反应的预测指标,并且添加了一个128秒的时域高通滤波器,以校正低频漂移。实验没有使用自相关校正。” “分析部分听上去很专业,不是吗?不过,你是否在对象部分注意到这条三文鱼'在扫描时处于无生命状态'?没错,克雷格在当地市场买了一条死三文鱼,放进磁共振成像仪,向它展示照片,然后向它提出问题。不过,由于立体像素数量众多,因此出现了一些假阳性,可以被解释成三文鱼对照片和问题的反应。只是这条三文鱼已经没有了生命。

这本书举了大量的案例来说明统计学上的谬误,采用的例子要么很典型,要么很有趣,有些干脆两样全占了。此书自称”只要会加减乘除即可读懂的简单统计学“,名副其实。行文语言风趣幽默,叙事上简洁明了,但是只要有吐槽的机会,作者绝不放过。是一本可以轻松阅读、又能学到东西的通俗读物。

《简单统计学》读后感:避开陷阱才能读准数据的语言

世上很多事物的表象具有迷惑性正如苏轼古诗《题西林壁》缩写:横看成岭侧成峰,远近高低各不同,不识庐山真面目,只缘身在此山中。这首诗描写的是人在面对一座山时,从不同的角度看会有不同的印象。时下人在面对更为复杂的各种现象时难免会碰到更多的迷雾,这时人们会借助各种数据分析来协助研究得出结论。但众多结论里面可能既有真理也有陷阱,如何插亮火眼金睛识破一本正经的胡说八道呢?我们需要掌握一些基本的统计学原理。

《简单统计学》是美国统计学家加里•史密斯所写。加里•史密斯是耶鲁大学博士,曾在耶鲁大学任教7年,他的课程因结合日常生活中的常见案例,深入浅出地分析数据而火爆日常。

《简单统计学》本书的编写风格与其教学风格相近,通篇基本由案例组成,没有复杂的公式和高深的统计原理,既像听故事也像在看侦探破案。作者巧妙地揭示生活中的各种数据骗局,并用简单的统计学原理揭穿了其中的把戏,加深读者对统计学原理的理解。《简单统计学》一共有19章,前面18章各自针对生活种常见的统计谬论来介绍案例,然后讲解出现这种谬论的原因、做法,每章结尾都有一个小结,教你如何轻松识破一本正经地胡说八道。第19章则是概括总结,教你面对数据分析何时相信,何时怀疑?总结了一系列可能导致谬论的陷阱如:模式诱惑、混杂因素、自选择偏差、幸存者偏差、图像变形、逻辑错误、聚集现象、均值回归和平均定律等等。

这些陷阱基本可分为两大类:一方面来源于数据自身,如自选择偏差、幸存者偏差、随机数据的聚集现象和均值回归等。另一方面来源于研究人员或者读者,如模式诱惑、图像变形和平均定律等。

数据自身的特点可能导致统计谬论。如自选择偏差是指做出不同选择的人本身可能就是不同的。很多数据在进入统计分析之前就有倾向性,比如对不同学历学生毕业后的工资对比。我们常听说大学毕业生的工资高于高中毕业生,工资差异似乎可以衡量上大学的财务回报,实际上大学毕业生工资高可能因为他们本身更聪明,更有抱负,而不仅限为学历的不同。幸存者偏差则往往出现在回溯性研究者中,比如一家航空公司的满意度调查中显示84%的人更喜欢这家航空公司,这个测试是在这家公司一架航班上的乘客中开展的。那么选择这家航空公司的旅行者当然更喜欢这家公司,这没什么好奇怪的。数据的聚集现象是指某种数据会巧合性地多次出现,比如连续性地投中三分球就像你抛硬币连续出现3次正面朝上,这无需过于惊奇进而寻找解释。均值回归是指极端值向平均值靠拢并不是平庸化,这是由于表现相对于能力波动导致的。这些大多由于数据来源或者数据本质属性被人们过度关注或解释而导致的一些谬误。

另一方面的陷阱来自研究人员或者读者。很多研究人员分析数据时沉迷于对模式、结论和统计显着性的追求,进而对数据进行修剪、取舍,基于一些特定的数据来开展数据分析。用数据来编造理论,自然会证明这种理论和这些数据相符合,但这可能只是相关性或者是统计谬论。图像变形是指改变横纵数轴的起点数据或者间距,故意夸大或缩小数据起伏,达到视觉上的误导作用。平均定律如人们认为赌博多次成功后则会迎来失败,或者多次失败后必会成功,这是错误的。就像人们扔硬币,正面代表成功,背面代表失败,哪怕连续5次扔硬币是正面向上,但第6次正面向上的概率还是50%,并不会因前面的状况而增加或者减少。

在大数据时代,数据分析就是一种分析工具。如同一把刀,用得好能帮你拨开迷雾,披荆斩棘,发现研究现象的因果关系;用得不好可能为数据所累,用搜刮的数据编造理论自欺欺人,甚至欺骗大众增加迷雾。

如何保持清醒避开陷阱无论对研究人员还是读者都至关重要。面对数据分析后的结论,我们保持警惕,既看结论,也查数据。思考原始数据的清理搜刮是否合理,数据模式的建立是否得到理论的解释,理论是否言之有理,能否通过新数据的检验。正如书名所言,简单统计学其原理大道至简。实践出真知,通过掌握基本原理,检查数据分析的理论能否经得起新数据的检验就是很好的考量标准。

《简单统计学》读后感:举例说明统计信息中存在的陷阱

我们生活在大数据人工智能时代。高性能的计算机和全球网络的强大组合正在得到人们的赞美甚至盲目崇拜,专家不断告诉我们,他们发现了一种新的能力,可以对海量数据进行筛查分析并发现真相,这将为我们的生活带来极大地便利。

但事实的确如此吗?现有的统计数据得出的结论就都正确吗?

很遗憾,并不是。很多统计数据是商家,学者带着其他的,非统计目的去完成的。他们不是为了通过统计发现事情真相,而是利用统计这种看似科学准确的形式来更好的宣传他们的理论,或者为了利益、学术成就、为了博人眼球,发布出不实的统计信息。

这些都是值得我们警惕的。当然首先我们应该了解这件事:统计不是全能的,不是所有市面上的统计信息都有价值。

耶鲁大学博士、畅销书作家加里·史密斯在其所着的《简单统计学》中分析认为,通过这本书,可以让读者更好地认识统计学和数据分析,更为清楚地洞察生活中滥用、错误使用数据的方式,更加轻松地识破以科学分析、统计分析、数据分析为名的各种奇谈怪论。

作者史密斯是美国作家是耶鲁大学博士,曾在耶鲁大学任教7年,两度获得教学奖。他的课程因为结合日常生活中的常见实例、深入浅出的分析数据而异常火爆。《简单统计学》共26余万字,共分成19个章节。全书通过数十个生动有趣、真实鲜活的案例,给我们一层层揭开数据背后的骗局。对于本书,罗伯特·希勒,诺贝尔经济学奖得主,《非理性繁荣》作者认为:这是本非常有趣的书,却揭示了非常严重的问题。我们经常会被数据愚弄,是时候拆穿这些诡计了。

在本书中作者用19个章节,分门别类的介绍了很多统计信息中存在的陷阱。我将从以下几个方面着重为大家介绍:

一.“去最好的学校”

什么是自觉选择偏差呢?看看下面这个例子,相信你会更清楚。

《纽约时报》华盛顿分部主任戴维·莱昂哈特关于经济主题的作品获得了包括普利策奖在内的多个奖项。2009年,他为《纽约时报》撰写了一篇专栏文章,对《穿越终点线》一书作了介绍。这本书的核心观点是,美国在“说服学生上大学”方面表现不错,但在“培养学生从大学毕业”方面则表现得不太理想。半数大学生无法毕业。他们发现的第一个“罪魁祸首”是匹配不足:一些学生本来可以去毕业率较高的大学,但他们却选择了毕业率较低的大学。鲍文教授告诉莱昂哈特:“许多来自贫困家庭的学生本来有更好的选择,但他们并没有就读适合自己的学校,这使我感到极为震惊。”总体而言,在学分积点高于3.5、大学入学考试成绩高于1200分的低收入准大学生中,大约有一半的人并没有选择更好的学校。例如,90%的密歇根大学学生可以在6年内毕业。在东密歇根大学这个比例只有40%。许多成绩足以进入密歇根大学的学生选择了东密歇根大学。要想从经济上解决这种匹配不足的问题,我们可以提高东密根大学的学费,或者降低密歌根大学的学费,以激励学生选择毕业率更际情况并没有这么简单。如果让这些所谓的“匹配不足”的学生就读密歌根大学,他们的毕业率可能会变得更低。

研究人员认为这些学生是随机分配到密歌根大学或东密歇根大学的,就像医生被随机分配阿司匹林或安慰剂一样。不过当数据涉及人们的选择时,就会出现“自选择偏差”。在这种情况下,对于做出不同选择的如,我们常常听人说,大学毕业生的工资高于高中毕业生,似乎人们观察到的工资差异可以衡量上大学的财人进行比较的做法是靠不住的务回报。不过,大学毕业生之所以工资比较高,部分原因在于他们比不上大学的人更聪明,更有抱负。实际上,做出不同选择的人本身可能就类似地,上述“匹配不足”的观点也存在自选择偏差。学生不仅会是不同的。选择上大学,他们还会选择上哪所大学。许多学生之所以选择东密歇根大学,而不是密歇根大学,也许是因为他们觉得自己很难从密歇根大学毕业。这可能是正确的选择。毕竟,他们比我们更了解自己的情况。

二.幸存者偏差

有时候商家企业呈现给我们的统计调查都是他们想让受众知道的信息,其实也就等于变相宣传企业文化。比如说对于法国旅行的统计调查:

过去两年你对法国进行过几次商务旅行?.过去两年你对法国进行过几次体闲旅行?你是否认为法国人不友好?假设大多数只对法国进行过一次商务旅行的人认为法国人不友好这也是他们从不自愿前往法国的原因。研究员将这些人的回答扔到一边假设大多数从未去过法国的人认为法国人不友好。这也是他们从不前往法国的原因。研究员将这些人的回答扔到一边假设大多数只对法国进行过一次休闲旅行的人认为法国人不友好是他们从不再次前往法国的原因。研究员将这些人的回答扔到一边设大多数对法国进行过不止一次休闲旅行的人太好了!这正是研究员想要的回答。法国旅游局可以根据这些回答进行广告宣传:大多数过去两年对法国进行过不止一次休闲旅行的美国人不认为法国人不友好。从字面上看,这种说法是正确的。但这种说法存在自选择偏差,因为选择重返法国的人几乎一定在上次旅行时玩得很开心不过,这种说法向人们提供了错误的暗示:大多数曾经去过法国的人希望再次前往法国这种偏差隐藏在所不意度调查中。一家航空公司曾经打出这样的广告/在经从纽约前往芝加哥的商业旅行者中,84%的人更喜欢这家航字公司,而不是另一家航空公司。这个广告令人困感的地方在在从细力飞往芝加哥的旅行者中,只有8%的人选择这家航空公司。如果84%的旅行者更喜欢这家公司,为什么选择这家公司的旅客只有8%呢?

答案是,84%这个数字所依据的调查对象是该公司从纽约飞往芝加哥的一架航班上的乘客。选择这家航空公司的旅行者更喜欢这家公司,这没有什么好奇怪的。真正奇怪的是,还有16%的旅客更喜欢另一家航空公司。不过,我们很难想象航空公司会打出这样的广告:“在乘坐我公司飞机的旅客中,16%的人感到后悔。”

最后还是要提醒大家,统计信息虽然用起来便利,有助于我们了解事物的本质和变化的趋势,但是请过度依赖和盲目轻信统计,因为即使是专家也可能会犯错。

《简单统计学》读后感:怎么才能不被谣言中的“数据研究表明”欺骗?

科技发达、信息无处不在的今天,谣言同样无处不在,甚至侵占着我们的时间。要成为一篇阅读量超过10万+的谣言神文,有套路,无外乎抓住关键的两点——一是炮制一个和每个人息息相关的、骇人听闻且违背生活常识的标题,主要是利用人们在常识上的缺失或者是对于突发事件的恐慌情绪,二是使用言之凿凿的数据说话,像“科学家数据研究表明……”之类的话,总会让人不明觉厉。

比如说我最近在朋友圈看到的谣言中就有一个完全反常识:《吸烟降低肠癌率》。

——what?吸烟有利于健康?

——然后,为了让看的人不要太意外,文章中居然煞有介事的认证的用数据来说话,拿出了一张权威机构的统计数据表,表中烟民死因的扇形图中烟民死于肠癌的比例低于非吸烟者

——于是一本正经的开始了胡说八道

——看看看,数据都明确说明了吸烟降低肠癌率,所以啊吸烟不是一无是处好吗。

——我是不信的,但是一定有人相信了,或者假装相信了,不要问我是从朋友圈里哪位抽烟不止的仁兄发的动态中看到的。

每天我们总会看到各种看似严谨的数据统计伪装下的胡说八道,于是有人就开始怪科学家,怪统计学,这些统计数据本身并没有错,错就错在人们不懂如何正确的使用统计学和这些数据。

前两天读了一本《简单统计学》,副标题就叫做“如何轻松识破一本正经的胡说八道”,在这个充斥着各种数据的时代,懂得利用数据,看到世界的真实模样,应该是我们安全生活的基本技能,而不仅仅是数据科学家的事情吧。

这本书脱胎于耶鲁大学热门统计学课程,作者加里史密斯博士是一位非常擅长深入浅出分析数据的教学高手,不管是在课堂上还是在本书中,他都擅长用生活中遇到的各种数据骗局,比如章鱼保罗的预测正确率,用简单的统计原理揭穿其玩弄数据的把戏,让你轻松掌握辨别数据、从数据口中问询真相的技巧。

这本书26万字共365页,不算太厚的一本书,大概用了1个半小时的时间就快速读完了这本书中的主要内容以及部分我比较感兴趣的案例。不大喜欢本书的翻译有点翻译腔但还在可接受范围内,内容比较有趣并有实用价值,确实值得一读。

这本书非常易读,说它易读是因为结构非常清晰,采用了总分总的结构:第1章综述我们为啥总是被骗,接下来2-18章用了大量贴近生活的数据骗局作为案例进行讲述,看的时候可以先翻到每章节的结尾“如何勤工”,先了解下这章的总结,然后依据兴趣选择性的看看这章到底有哪些一本正经的胡说八道。第19章则是对2-18章的总结,告诉我们“何时相信,何时怀疑”。

看完这本《简单统计学》后,给我印象最深刻的一句话是“数据和理论,两者缺一不可。”想要理解这句话,首先我们要明确的意识到,我们被骗的根本原因在哪。

对于文字、数据、金融这些随着时代而来的产物,我们那进化并不算快的大脑天生有种无力感,我们依旧使用着一些适用于远古祖先的方法或技能来面对越来越复杂的现代世界。我们总是被内心的一种渴望给诱导着,这种渴望叫做:理解并解释这个世界。

正如书中所阐述的——我们很容易产生两种认知错误,一是被模式以及解释模式的理论所诱导,二是我们只相信我们愿意相信的,一旦发现有数据支持这种理论我们便会死咬住不放,而忽视哪些不符合它的证据。正是因为我们的这种认知缺陷,才让世界上出现了如此众多荒谬有趣的统计性骗局。

了解了我们自己的认知缺陷后,“数据和理论,两者缺一不可。”这句话就不难理解。

这句话有两层含义:第一层是数据离不开理论。

无论从数据上看来是多么符合某种模式,但一定要寻求理论的支持,也就是问一问出现这种数据现象背后的原因,尤其是它看起来不那么符合常识的时候,更要多问几个为什么。

比如说前面提到的《吸烟降低肠癌率》中的数据——烟民死因的扇形图中烟民死于肠癌的比例低于非吸烟者——出现这个数据的原因,究竟是因为吸烟真的能降低肠癌率呢,还是烟民死于其他癌症或疾病的比例要远高于非吸烟者?——答案从常识以及其他数据支持来看,明显是后者,因此这个谣言很容易就被粉碎了。

“数据和理论,两者缺一不可。”的第二层含义是理论离不开数据。

无论一个理论看起来有多么完美,没有真实的完整数据支持,它只能是理论。

尤其强调的是,我们不仅仅要关注到有数据支持,还要关注这个数据的真实性、有效性、完整性。一定要牢记前面提到的“我们的容易相信我们愿意相信的”这个认知缺陷,不要只看支持这种理论的数据,更要去看完整的数据中,是不是所有数据都支持这种理论,还是说有被我们有意或无意给忽略掉的与理论有冲突的数据。

书中还讲了很多统计学的基础的真伪辨识方法和考虑因素,比如说自选择偏差、幸存者偏差、变形的图像导致的数据歪曲,肤浅的比较方法,混杂因素等等。只要牢记“数据和理论,两者缺一不可。”这句话并时刻提醒自己应用这句话去做判断,一定能更好的理解和应用统计学中的各种原理和方法。

回头看看些活跃在朋友圈中10万+的谣言,每一次被辟谣后,人们总说“我们被数据给骗了”,但数据并不会说谎,是我们自己会错了意,被统计学欺骗了,形成了错误的认知。理想状况下,我们希望追求最优决策,但在现实这个不确定的世界里,正如书中所说“最优决策可遇不可求,最不坏的决策才是现实的追求,善用统计学即可达成最不坏的决策”。所以学点简单统计学是个不错的决策,至少能让我们面对陌生的信息,能具备起码的辨别力。

有时间的情况下,我打算将书中几十个扭曲数据意愿得出奇怪结论的案例看完,并在茶余饭后分享给我的家人和朋友,通过这种方式也许可以让我的朋友圈少一些谣言。

免责申明:以上内容属作者个人观点,版权归原作者所有,不代表红颜文学网_教育热点新闻_作文怎么写_文学作品赏析_2020抗击疫情优秀作文立场!登载此文只为提供信息参考,并不用于任何商业目的。如有侵权或内容不符,请联系我们处理,谢谢合作!
当前文章地址:https://www.hyjzdh.com/zuowen/904449.html 感谢你把文章分享给有需要的朋友!
上一篇:搞笑心情语录:只因在人群中多看了你一眼 你就叫我上黑板答题 搞笑问答题 下一篇: 《朋友圈的尖子生》的读后感10篇 马文亚