拆穿数据胡扯 (original) (raw)
内容简介 · · · · · ·
“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?
X 让人看不懂的数据分析和神奇算法
X 莫名奇妙的数学方程
X 强行联系因果的统计学论文
X 某些新闻报道或PPT中花里胡哨的图表
……
我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!
一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?
对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。
两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪...
“用数据说话”是互联网时代的通用思维方式,有人说数据不会骗人,真的是这样吗?
X 让人看不懂的数据分析和神奇算法
X 莫名奇妙的数学方程
X 强行联系因果的统计学论文
X 某些新闻报道或PPT中花里胡哨的图表
……
我们都曾经或正在被这些东西蒙蔽,却往往毫无察觉,甚至乐在其中!
一些貌似可靠的数据来源,也可能藏着一本正经的胡说八道。比如TED演讲中的统计数字、《纽约时报》等媒体报道的大数据分析新算法、甚至是医学期刊中的诊断数据……虚假信息都有可能鱼目混珠,而你能分辨其中哪些是真正有用的信息,哪些只是胡扯吗?
对此,华盛顿大学专门开发了一门尚未开课即爆满的公开课,而这本书正是源自这门引发热议的课程。
两位作者花了多年时间研究打着数学和统计学幌子的胡扯,犀利幽默地对它们分门别类一一剖析,帮助我们培养批判性思维,有效分析海量数据和观点,拆穿无用数据的精致伪装,在信息时代做个游刃有余的明白人。
话说回来,除了教会你如何识别数据胡扯,当你迫不得已需要胡扯时,它也会成为一本实操性强的工具书呢!
拆穿数据胡扯的创作者 · · · · · ·
作者简介 · · · · · ·
卡尔·伯格斯特龙(Carl Bergstrom)
美国华盛顿大学生物学系教授。他研究流行病如何在人群中传播,以及信息如何大规模地在生物和社会系统中流动——从细胞内对基因表达的控制到社交媒体上错误信息的传播。他最为人所知的是跨界整合自然科学和社会科学思想的能力,特别是在信息研究领域造诣很深。2010年以来,他发表了多篇前瞻性的文章,涉及信息科学、计算机科学、控制论、进化生物学、信息论、科学哲学、物理学等方面。其中有很多都发表在《自然》《科学》《美国国家科学院院刊》上。
杰文·韦斯特(Jevin D.West)
美国华盛顿大学信息学院副教授、公众知情中心主任。
目录 · · · · · ·
推荐序1 科学地对抗科学的胡扯的“胡扯” / V
推荐序2 拨开扯淡的迷雾 / IX
推荐序3 闲得没事也别胡扯 / XIII
前 言 / XVII
第1 章 胡扯无处不在
惯于欺骗的甲壳类动物和狡猾的乌鸦 / 003
· · · · · · (更多)
推荐序1 科学地对抗科学的胡扯的“胡扯” / V
推荐序2 拨开扯淡的迷雾 / IX
推荐序3 闲得没事也别胡扯 / XIII
前 言 / XVII
第1 章 胡扯无处不在
惯于欺骗的甲壳类动物和狡猾的乌鸦 / 003
狡辩之词和律师的语言 / 008
谎言传千里,真相难出门 / 012
第2 章 媒体、信息和错误信息
印刷厂就是妓院 / 022
不加渲染的事实宛若凤毛麟角 / 025
偏见性、个人化和对立 / 029
错误信息和虚假信息 / 033
新型造假者 / 037
第3 章 胡扯的本质
胡扯与黑箱 / 048
刑事机器学习 / 051
第4 章 因果关系
夜晚天空红艳艳,水手脸上笑容现 / 060
关于因果关系的思考 / 064
相关性不会增加报纸销量 / 068
延迟享乐与共同原因 / 076
伪相关性 / 078
吸烟不会导致死亡? / 083
如果其他方法都行不通,那就人为操控吧 / 084
第5 章 数字与胡扯
提取数字 / 095
有害的百分比 / 098
古德哈特定律 / 106
数学滥用 / 110
僵尸统计数据 / 115
第6 章 选择偏倚
你看到什么取决于你看的是哪儿 / 126
隐藏在墨菲定律背后的原因 / 129
帅哥和顶级程序员 / 137
音乐才华的致命危险 / 143
消除选择偏倚 / 148
第7 章 数据可视化
数据可视化的发端 / 158
鸭子! / 162
水晶鞋和丑陋的继姐 / 166
邪恶的轴 / 177
比例油墨原理 / 192
第8 章 大数据与胡扯
机器是怎么看到东西的 / 213
废料进,废品出 / 219
同性恋雷达和胡扯的结论 / 221
机器是怎么思考的 / 226
机器为什么失败 / 230
第9 章 科学的易感性
检察官谬误 / 242
p 值操纵和发表偏倚 / 251
点击诱饵科学 / 260
胡扯科学的市场 / 265
科学为什么有用 / 271
第10 章 辨别胡扯
1. 质疑信息来源 / 278
2. 小心不公平的比较 / 281
3.如果好得或糟糕得不像是真的…… / 284
4. 从数量级考虑 / 287
5. 避免证真偏差 / 292
6. 考虑多个假设 / 295
辨别网上的胡扯 / 296
第11 章 驳斥胡扯
使用归谬法 / 306
要让人难以忘记 / 308
寻找反例 / 311
使用类比 / 312
重新绘制图表 / 314
使用零模型 / 316
揭穿者心理 / 319
致 谢 / 329
注 释 / 333
参考文献 / 349
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
- 一个多世纪前,哲学家约翰·亚历山大·史密斯在对牛津大学新生发表演讲时说:月年本复微的测富头清具确管即出增 你在学校学到的东西对你(将来的生活)几乎毫无用处,但它有一个好处:只要你认真学习,方法得当,那么在别人胡说八道的时候你会有所察觉。我认为,这即使不是教育的唯一目的,也是它的一个主要目的。 (查看原文)
韧勉 5赞
2022-04-03 22:54:45
—— 引自章节:前 言 / XVII - 证真偏差是指人们往往会注意与我们已有的信念相一致的信息。如果某个言论与我们相信的信念相一致,我们更倾向于接受它,而不太可能怀疑它的真实性。我们对证真偏差的易感性可以用社会学家尼尔·波兹曼的那句名加以概括:“在任何时候,你必须与之抗争的胡扯主要源于你自己。” (查看原文)
—— 引自章节:5. 避免证真偏差 / 292
> 全部原文摘录
喜欢读"拆穿数据胡扯"的人也喜欢的电子书 · · · · · ·
支持 Web、iPhone、iPad、Android 阅读器
23.40元
17.64元
29.90元
21.24元
16.99元
喜欢读"拆穿数据胡扯"的人也喜欢 · · · · · ·
这本写得非常认真,干货和软技能兼备,可以说是媒介素养的必修课。从统计偏差、可视化误区、算法偏见,到期刊论文的谬误和夸大的科学新闻,涵盖了这个主题下的方方面面。(当然每个话题都有书籍单独论述,读过就会发现案例很眼熟。)第10章的辨别手段足以对付社交媒体上一大半的错误信息。即使公开反驳很难,至少可以清理自己眼前的垃圾。
星尘 2022-05-11 20:27:57
4 有用
可以配合另一本《数据如何误导了我们》一起阅读,两本书的话题一致,而且都很精彩,直面我们每天都会遇到的胡扯与欺骗。 陈嘉映有一个观点是这样说的,我们今天的困境不在于信息不够,而在于判断力不够。 信息时代我们每天都会获取大量的信息,有用的无用的,真实的片面的虚假的,而且我们往往还倾向于获取更多的信息。 但是!但是!但是!如果一个人判断真伪的能力没有跟上他获取信息的能力的话,他就会觉得世界变得越来越荒谬... 可以配合另一本《数据如何误导了我们》一起阅读,两本书的话题一致,而且都很精彩,直面我们每天都会遇到的胡扯与欺骗。 陈嘉映有一个观点是这样说的,我们今天的困境不在于信息不够,而在于判断力不够。 信息时代我们每天都会获取大量的信息,有用的无用的,真实的片面的虚假的,而且我们往往还倾向于获取更多的信息。 但是!但是!但是!如果一个人判断真伪的能力没有跟上他获取信息的能力的话,他就会觉得世界变得越来越荒谬了。 这大概不是一件好事情 (展开)
拆穿数据胡扯的书评 · · · · · ·( 全部 27 条 )
星尘 2022-05-12 19:04:31
信息爆炸的当下,我们还能寻觅到真实吗?
这篇书评可能有关键情节透露
《拆穿数据胡扯》中提出了一个假设:如果人们无须付出任何代价,就能轻松、即时地验证你说的话(或者别人说的话),那胡扯还会有立足之地吗? 看上去,答案似乎是否定的,我们被胡扯蒙蔽,往往是因为无法获取到真实信息。既然真实唾手可得,那胡扯当然会无所遁形。 但遗憾的是... (展开)
浪里白条 2022-04-27 15:54:56
信息化时代的生存指南
深夜,你感到有点口渴,翻出一瓶饮料,但又担心喝了以后睡不着。你仔细看了饮料的配料表,上面赫然写着99.9%不含咖啡因,也就是说咖啡因的含量低于0.1%。于是你放心的把饮料喝完。在这个辗转反侧的夜晚,你哭着上网搜索,原来浓咖啡的咖啡因含量也不过是0.075%。换句话说,几乎... (展开)
星尘 2022-05-12 18:50:26
《拆穿数据胡扯》中提到或提出的精彩观点
这篇书评可能有关键情节透露
01.技术并没有消除胡扯问题,而是让问题变得更糟。浮华空洞之物,取代了严肃、深入、有思想的内容。(p21) 02.古德哈特定律:指标变成目标后,就不再是一个好的指标。(p108) 03.证真偏差:人们往往会注意、相信和分享与我们已有信念相一致的信息。(p292) 04.在任何时候,... (展开)
中信出版鹦鹉螺 2022-03-09 11:50:34
数据,新式胡扯者的杀手锏
早间新闻说上个月的消费指数上升了n个点; 手机上跳出实时的股票涨跌,顺便可以看一下上市公司的年报以判断股票前景; 工作例会上,你使用的数据PPT模板让展示更加美观有趣,获得老板好评; 你心情不错想听听音乐,音乐APP跳出你的上周听歌时长统计,再听n首便可升级; 一把游... (展开)
透明人leon 2022-06-30 23:11:19
互联网上没有人知道你是一条狗
随着数据化时代的来临,让我们对数据越来越依赖,甚至有时会偏信由数据推论的一切结论。然而事实证明,科技水平的提升并不能自动清除胡扯,相反“技术并没有消除胡扯问题,而是让问题变得更糟。”一方面许多科学研究者本身在有意或无意地生产胡扯,另一方面各种欺骗或谣言已开... (展开)
流星小天马 2022-04-04 20:09:29
关于如何避免被网络上的各种信息忽悠这件小事
千万不要被这本书的书名给欺骗了! 互联网时代带来了可怕的信息爆炸,我们每天都会处理远胜于祖先的信息接收量。其中信息真假参半,有些我们会嗤之以鼻,有些则模凌两可,而一部分符合我们论断的会被我们转发、传播。但我们会不会无意中传播了不实或者片面的信息呢? 紧贴时事... (展开)
wsdb 2023-03-05 18:27:17
关于本书的思维导图
这篇书评可能有关键情节透露
这是本人阅读此书时觉得有用的内容的一些摘录。一些章节可能没有摘录。是我自我学习的一个草稿,可以用于了解本书大纲。贡献给各位,以免沉睡在硬盘中。 非常佩服作者的努力。所有的赞美都应归于他们。 重要的在第10章 辨别胡扯和第11章 驳斥胡扯。 序1 科学地对抗胡扯 老派胡... (展开)
Behemoth 2022-12-15 23:34:43
洞察噪声之后的真相
这篇书评可能有关键情节透露
信息时代在给人们带来了种种便利的同时,也带来了众多的挑战和问题。其中,最为突出的一个问题是人们被大量信息所淹没,难以分辨哪些信息是可信的,哪些信息是不可信的。在这种情况下,人们往往会被虚假信息所误导,影响他们的决策和行为。 因此,我们需要具备一定的信息素养和... (展开)
灰灰木 2022-05-08 23:24:55
如何辨别无处不在的胡扯?
这篇书评可能有关键情节透露
你是否发现,我们身边充斥着各种各样的胡扯? 然后,很多胡扯在潜意识里影响我们的认知和判断。而我们,对这些胡扯,还全然不知。 卡尔·伯格斯特龙与杰文·韦斯特共同撰写的《拆穿数据胡扯》为我们详细地描述了生活中的那些胡扯,以及我们该如何辨别这些胡扯。 下面,就让我们... (展开)
幸有我来风未孤 2022-04-28 02:43:59
永不放弃对虚假的辨别和对真相的追求
看到这本书的书名,就涌起了要读的念头。细细翻来,确实是非常值得一读的,而且我认为是非常契合处于信息爆炸时代的大家。 书名叫《拆穿数据胡扯》。而本书的结构则是分为三大部分,非常有条理,读来有循序渐进的自然感。第一部分说了数据和胡扯的来源;第二部分说了胡扯的本质... (展开)
> 更多书评 27篇