WEBVTT 00:00:00.714 --> 00:00:03.750 早在2003年 00:00:03.750 --> 00:00:07.453 英国政府进行了一项调查 00:00:07.453 --> 00:00:10.663 目的是了解国民的 00:00:10.667 --> 00:00:11.934 算术能力 00:00:11.934 --> 00:00:13.631 结果非常让人吃惊 00:00:13.631 --> 00:00:16.809 在英国,每100个正值 工作年纪的成人中 00:00:16.809 --> 00:00:20.894 47个缺乏一级的算术能力 00:00:20.894 --> 00:00:25.414 一级算术能力 是GSCE考试的低端分数 00:00:25.414 --> 00:00:28.688 它是运算分数 百分数和小数的能力 00:00:28.688 --> 00:00:33.340 这个数据使英国行政部门愈发的担忧 00:00:33.340 --> 00:00:34.982 (他们)改变了政策 00:00:34.986 --> 00:00:36.738 进行了投资 00:00:36.738 --> 00:00:39.800 然后到了2011年 他们再次进行了普查 00:00:39.800 --> 00:00:44.019 你们能猜到这一次的数字吗? 00:00:44.029 --> 00:00:45.465 这次,上升到了49 NOTE Paragraph 00:00:45.465 --> 00:00:46.968 (观众笑声) NOTE Paragraph 00:00:46.968 --> 00:00:49.295 事实上,当我在金融时报 报道这一数据时 00:00:49.295 --> 00:00:50.990 有个读者开玩笑地说 00:00:50.990 --> 00:00:54.845 “这个数据只震惊了51%的人口” NOTE Paragraph 00:00:54.845 --> 00:00:57.231 (观众笑声) NOTE Paragraph 00:00:57.231 --> 00:01:00.402 但我实际上更喜欢一个学生的反应 00:01:00.406 --> 00:01:03.125 有一次我在学校展示这一信息时 00:01:03.125 --> 00:01:05.086 这个孩子举手说道 00:01:05.086 --> 00:01:07.130 “我们怎么知道得出这一数据的人 00:01:07.130 --> 00:01:09.465 不是49%中的一个呢?” NOTE Paragraph 00:01:09.465 --> 00:01:10.743 (观众笑声) NOTE Paragraph 00:01:10.743 --> 00:01:14.807 很明显,算术能力成了一个问题 00:01:14.811 --> 00:01:16.675 毕竟这是生活中的重要技能 00:01:16.675 --> 00:01:20.842 更何况我们还想为这个 世纪带来许多的改变 00:01:20.842 --> 00:01:23.041 这需要我们对数字越来越应用自如 NOTE Paragraph 00:01:23.041 --> 00:01:25.073 实际上,不仅英国存在这样的的问题 00:01:25.073 --> 00:01:30.127 OECD今年发布了一些 关于青少年计算能力的数据 00:01:30.127 --> 00:01:32.821 名单里领先的是美国 00:01:32.821 --> 00:01:37.621 大约40%的美国青少年 算术能力低下 00:01:37.625 --> 00:01:38.942 英国也名列其中 00:01:38.946 --> 00:01:44.123 但是有七个OECD国家的 数据在20%以上 00:01:44.123 --> 00:01:46.846 这就有问题了 因为情况本不必如此 00:01:46.846 --> 00:01:49.078 在图的最右端 00:01:49.078 --> 00:01:52.242 可以看到荷兰,韩国都是个位数 00:01:52.242 --> 00:01:56.718 所以,这里绝对有一个算术 问题需要我们解决 NOTE Paragraph 00:01:57.510 --> 00:02:00.460 和这些研究同样有用的是, 00:02:00.464 --> 00:02:05.884 我认为我们无意间轻率地 将人群分成了两个类别 00:02:05.888 --> 00:02:07.694 也就是这么两种人 00:02:07.694 --> 00:02:12.057 对数字可以应用自如 能够把玩数字的人 00:02:12.061 --> 00:02:14.317 和做不到这一点的人 00:02:14.321 --> 00:02:16.346 今天,我想要探讨的是 00:02:16.346 --> 00:02:19.508 我认为这是个错误的二分法 00:02:19.512 --> 00:02:21.430 这并不是一成不变的组合 00:02:21.430 --> 00:02:25.072 我认为,你不需要高超的算术能力 00:02:25.076 --> 00:02:26.784 才能被数字所启发 00:02:26.784 --> 00:02:29.937 这应该成为前路的起点 NOTE Paragraph 00:02:30.387 --> 00:02:34.718 对于我来说,这条路的起始点之一 00:02:34.722 --> 00:02:36.468 是着眼于统计学 00:02:36.472 --> 00:02:39.987 这里,我要首先承认 统计是有那么一点儿 00:02:39.991 --> 00:02:41.379 画面方面的问题的 00:02:41.379 --> 00:02:42.400 (观众笑声) NOTE Paragraph 00:02:42.404 --> 00:02:43.966 统计是数学的一部分 NOTE Paragraph 00:02:43.966 --> 00:02:47.039 但是它是连数学家 都不怎么喜欢的那一部分 00:02:47.043 --> 00:02:51.055 因为与其它讲究精确 与确定性的数学领域不同 00:02:51.059 --> 00:02:53.363 统计学几乎是反其道而行之 00:02:53.793 --> 00:02:58.468 事实上,我自己也是 后来才转向统计学的 00:02:58.472 --> 00:03:00.584 如果你们去问问我本科时的教授 00:03:00.584 --> 00:03:05.357 我大学毕业后最不可能 有卓越成就的两个领域是什么 00:03:05.361 --> 00:03:08.112 他们会告诉你是统计和电脑编程 00:03:08.112 --> 00:03:10.681 然而现在,我要用我编的程序 00:03:10.681 --> 00:03:12.397 给你们展示统计图表 NOTE Paragraph 00:03:12.397 --> 00:03:14.420 是什么激发我有了这样的转变呢? 00:03:14.420 --> 00:03:18.212 是什么让我对统计产生了兴趣? 00:03:18.212 --> 00:03:20.882 那是因为统计学是 研究我们自身的科学 00:03:20.882 --> 00:03:23.491 如果你看看统计 (statistics) 的词源 00:03:23.491 --> 00:03:26.104 它是处理数据的科学 00:03:26.108 --> 00:03:28.558 围绕着我们所生活的国家或社区 00:03:28.562 --> 00:03:31.936 所以,统计学是研究 作为一个群体的我们 00:03:31.940 --> 00:03:33.519 不是作为个人的我们 00:03:33.519 --> 00:03:34.853 而且我认为作为一种群居动物 00:03:34.853 --> 00:03:39.061 我们会分享对作为一个个体, 如何与所在的群体以及同辈之间 00:03:39.061 --> 00:03:40.519 发生联系的那种痴迷 00:03:40.519 --> 00:03:43.653 统计最强大的时候 00:03:43.653 --> 00:03:45.468 是当它让我们惊讶的时候 NOTE Paragraph 00:03:45.477 --> 00:03:48.684 伊普索莫利(英国第二大市场调查组织) 在过去几年进行过 00:03:48.688 --> 00:03:50.442 一些很有意义的调查 00:03:50.446 --> 00:03:53.164 他们调查了超过1000个英国的成年人 00:03:53.164 --> 00:03:56.988 提出的问题是在每一百个 英格兰和威尔士人当中 00:03:56.988 --> 00:03:58.862 有多少个穆斯林? 00:03:58.862 --> 00:04:01.522 调查的平均答案 00:04:01.526 --> 00:04:07.212 是24,这是具有国民代表性的答案 00:04:07.212 --> 00:04:08.432 这是国民的想法 00:04:08.432 --> 00:04:12.005 英国人认为,在自己国家 每100个人中,有24个信仰穆斯林 00:04:12.005 --> 00:04:16.755 而官方数据显示这个数字大约是5 00:04:17.732 --> 00:04:21.749 很明显,我们的感知 与被统计资料呈现的事实之间 00:04:21.749 --> 00:04:23.765 有着巨大的差异 00:04:23.765 --> 00:04:24.703 我觉得这很有趣 00:04:24.703 --> 00:04:28.663 是什么原因引起 这样的感知差距呢? NOTE Paragraph 00:04:29.212 --> 00:04:30.876 我对这个研究感到很兴奋 00:04:30.876 --> 00:04:33.824 并开始在各种演讲中提出这个问题 00:04:33.824 --> 00:04:35.322 我曾经在哈默史密斯的 00:04:35.322 --> 00:04:38.146 圣保罗女子中学做过一个演讲 00:04:38.150 --> 00:04:40.320 当时我有一群像现在这样的观众 00:04:40.334 --> 00:04:44.186 唯一的差别是观众都是 六年级的女学生 00:04:44.186 --> 00:04:46.622 我说道,“姑娘们, 00:04:47.598 --> 00:04:52.135 你们觉得英国公众认为 每年有多少个 00:04:52.135 --> 00:04:53.907 青春期女孩怀孕?” 00:04:53.907 --> 00:04:56.613 当我说出答案,女孩们是非常生气的 00:04:57.453 --> 00:05:01.366 我说英国公众认为 每一百个青春期女孩中 00:05:01.370 --> 00:05:02.833 每年有15个怀孕 00:05:03.429 --> 00:05:05.644 当然她们有生气的缘由和权利 00:05:05.644 --> 00:05:08.472 因为实际上根据官方数字, 00:05:08.472 --> 00:05:10.066 (按比例)我必须要有近200个点 00:05:10.066 --> 00:05:12.605 才能将一个空白圆圈涂满色 NOTE Paragraph 00:05:12.605 --> 00:05:16.419 和计算能力一样 这同样不仅仅是英国的问题 00:05:16.423 --> 00:05:20.957 伊普索莫利机构在最近几年 在世界范围内扩展了调查研究 00:05:20.957 --> 00:05:23.921 他们问沙特阿拉伯人 00:05:23.925 --> 00:05:26.476 在你们国家,每一百个成年人中 00:05:26.476 --> 00:05:29.343 有多少个超重或是有肥胖症? 00:05:30.526 --> 00:05:35.859 平均答案是四分之一多一点 00:05:36.402 --> 00:05:37.088 那是他们认为的 00:05:37.088 --> 00:05:39.850 仅仅是四分之一多一点的 成年人超重或有肥胖症 00:05:39.850 --> 00:05:45.041 官方数据显示,实际上 这个数字接近四分之三 NOTE Paragraph 00:05:45.041 --> 00:05:46.475 (观众笑声) NOTE Paragraph 00:05:46.475 --> 00:05:48.817 这又是一个巨大的差异 NOTE Paragraph 00:05:48.821 --> 00:05:53.261 下面这个调查我很喜欢 他们问了日本人 00:05:53.261 --> 00:05:55.245 每一百个日本人里面 00:05:55.245 --> 00:05:58.516 有多少人住在乡下? 00:05:58.521 --> 00:06:03.442 平均答案大概是一半, 稍高于50% 00:06:03.446 --> 00:06:07.613 他们认为每100个日本人中 有56个居住在乡村地区 00:06:07.617 --> 00:06:09.304 而官方数字是7 NOTE Paragraph 00:06:10.259 --> 00:06:14.729 如此巨大的差异震惊了一些人 00:06:14.733 --> 00:06:17.212 但是对一些人来说并不惊讶 00:06:17.212 --> 00:06:21.558 比如阅读过诺贝尔经济学奖获得者 丹尼尔·卡内曼的研究成果的人 00:06:21.562 --> 00:06:26.684 他和他的同事,阿莫斯·特沃斯基 花费了数年的心血在这个 00:06:26.684 --> 00:06:29.783 人们的见解与现实脱节的问题上 00:06:29.783 --> 00:06:33.628 实际上人们是直觉很差的统计学家 00:06:33.628 --> 00:06:35.126 这背后有着很多原因 00:06:35.126 --> 00:06:38.401 个人体验,当然可以影响我们的见解 00:06:38.401 --> 00:06:42.523 但也包括媒体带有偏见 00:06:42.527 --> 00:06:44.223 而非全面客观的报道 00:06:44.855 --> 00:06:46.695 卡内曼对此有一个很好的描述 00:06:46.695 --> 00:06:48.400 他说,“我们对显而易见的 事情视而不见”—— 00:06:48.400 --> 00:06:50.032 所以我们有了错误的数字—— 00:06:50.032 --> 00:06:52.672 “但是我们可以对我们视而不见 这个事实视而不见。” 00:06:52.672 --> 00:06:56.408 而这对做决策来说有巨大的影响 NOTE Paragraph 00:06:56.412 --> 00:06:59.218 那么在统计学办公室, 当这些事情在发生的时候 00:06:59.218 --> 00:07:00.550 我觉得很有趣 00:07:00.550 --> 00:07:02.388 我认为显然这是一个全球性的问题 00:07:02.388 --> 00:07:05.713 但也许与地域差异有关 00:07:05.717 --> 00:07:09.610 这里的一些问题都是关于 你对你的国家了解多少 00:07:09.610 --> 00:07:13.683 在这个问题里,是在问关于 你对6400万人口了解多少? 00:07:13.683 --> 00:07:16.429 结果是,我并不是很了解 00:07:16.429 --> 00:07:17.777 所以我有了一个想法 00:07:17.777 --> 00:07:20.854 是用相同的方法 00:07:20.854 --> 00:07:23.053 但是以一种非常地方化的方式来思考 00:07:23.053 --> 00:07:24.258 这是因地制宜的吗? 00:07:24.262 --> 00:07:26.147 如果我们重新思考问题然后说 00:07:26.147 --> 00:07:28.369 你对你的当地状况了解多少? 00:07:28.373 --> 00:07:30.476 你的答案会更准确吗? NOTE Paragraph 00:07:31.817 --> 00:07:33.609 对此我设计了一个测试 00:07:33.609 --> 00:07:35.462 你对你居住的地区了解多少? 00:07:36.454 --> 00:07:38.403 是一个简单的网络应用 00:07:38.403 --> 00:07:39.334 输入邮编 00:07:39.334 --> 00:07:42.311 它会根据你所在地区的普查数据 00:07:42.311 --> 00:07:43.844 给你提出问题 00:07:44.305 --> 00:07:46.268 我在设计时有特别注意 00:07:46.268 --> 00:07:50.411 想要让它适用于最广范围的人群 00:07:50.411 --> 00:07:53.433 不仅仅是49%的会把玩数字的人 00:07:53.437 --> 00:07:54.772 我想要每个人都能参与 00:07:54.772 --> 00:07:56.755 所以,针对测试的设计 00:07:56.755 --> 00:08:00.420 我的灵感是由19世纪20到30年代 奥图·纽拉特的 00:08:00.420 --> 00:08:03.036 “同形像”所激发 00:08:03.036 --> 00:08:07.398 这是使用重复图标 00:08:07.402 --> 00:08:09.635 来代表数字的方法 00:08:09.640 --> 00:08:12.825 那些数字仅仅是作为背景 00:08:12.829 --> 00:08:15.376 所以这是一个代表数量的绝佳方式 00:08:15.376 --> 00:08:18.580 不需要使用“百分比” 00:08:18.584 --> 00:08:19.844 “分数” 和“比率” NOTE Paragraph 00:08:19.844 --> 00:08:21.540 这个就是测试界面 00:08:22.310 --> 00:08:23.997 界面的布局是 00:08:23.997 --> 00:08:26.334 你左手边有重复出现的图标 00:08:26.334 --> 00:08:29.431 然后这里有一张地图 展现我们问你问题的地区 00:08:29.431 --> 00:08:30.728 在右手边 00:08:30.728 --> 00:08:32.317 一共有七个问题 00:08:32.317 --> 00:08:36.380 对于每一个问题,这里有 一个从0到100的可能的答案 00:08:36.384 --> 00:08:37.523 在测试结尾 00:08:37.523 --> 00:08:40.995 你会得到一个在0和100之间的总分 00:08:40.999 --> 00:08:43.103 因为这是TEDx埃克塞特 00:08:43.107 --> 00:08:44.946 我们可以快速看一下关于 00:08:44.946 --> 00:08:47.749 埃克塞特的前几个问题 00:08:47.749 --> 00:08:48.828 第一个问题是 00:08:48.828 --> 00:08:52.790 每一百人中 有多少个在十六岁以下? 00:08:52.790 --> 00:08:56.288 当然,我对于埃克塞特不那么了解 所以我随便猜了一下 00:08:56.288 --> 00:08:58.989 主要是演示这个测试怎样进行 00:08:58.993 --> 00:09:02.729 你将滑块拖至你所认可的数据图标 00:09:02.729 --> 00:09:04.988 然后点击“递交” 00:09:04.988 --> 00:09:08.685 然后我们将你的答案和现实之间的 差异用动画的方式表现出来 00:09:08.685 --> 00:09:13.164 结果是,我错得很离谱, 只得了五分 NOTE Paragraph 00:09:13.164 --> 00:09:14.143 那么下一个问题呢? 00:09:14.143 --> 00:09:16.653 这是问关于年龄的中位数 00:09:16.653 --> 00:09:19.166 也就是该地区大于和小于这个年龄的 00:09:19.166 --> 00:09:20.350 人口数相等 00:09:20.350 --> 00:09:24.288 我以为是35—— 那对我来说是中年 NOTE Paragraph 00:09:24.288 --> 00:09:25.761 (观众笑声) NOTE Paragraph 00:09:28.206 --> 00:09:30.332 实际上,在埃克塞特 结果是惊人的年轻 00:09:30.336 --> 00:09:34.874 是我低估了大学在这个区域的影响 00:09:34.874 --> 00:09:36.969 随着测试的进行问题的难度会增加 00:09:36.969 --> 00:09:39.966 这个问题有关房屋所有权 00:09:39.966 --> 00:09:43.648 在一百个家庭中,有多少个 是有贷款或借债的? 00:09:43.648 --> 00:09:44.998 我没有直接选出脑海中的数字 00:09:44.998 --> 00:09:48.140 因为我不想有超过五十个 NOTE Paragraph 00:09:48.140 --> 00:09:50.154 (观众笑声) NOTE Paragraph 00:09:50.154 --> 00:09:52.624 实际上,这些问题 变得越来越困难 00:09:52.624 --> 00:09:55.311 因为当你在一个地区 在一个社区 00:09:55.311 --> 00:10:00.625 人口是否老龄化或是年轻化 这样的事情,是很容易找到线索的 00:10:00.625 --> 00:10:02.624 看看周围环境就知道了 00:10:02.624 --> 00:10:06.555 像房屋所有权这样的事 要观察起来就困难得多 00:10:06.559 --> 00:10:09.147 所以我们还原了我们的启发法 00:10:09.147 --> 00:10:13.692 关于我们自认为有 多少人拥有房屋所有权的偏差 NOTE Paragraph 00:10:13.692 --> 00:10:17.366 然而真相是 当我们发表这个测试时 00:10:17.366 --> 00:10:20.916 我们所依据的普查数据 已经是好几年前的了 00:10:20.920 --> 00:10:24.423 我们有一个在线应用 你可以输入邮编 00:10:24.423 --> 00:10:26.627 然后得到过去几年的数据 00:10:26.631 --> 00:10:27.590 所以,在某种程度上 00:10:27.590 --> 00:10:31.423 这是有点儿过时的数据 00:10:31.423 --> 00:10:35.050 但是我很感兴趣 会得到什么样的反应 00:10:35.050 --> 00:10:37.817 用我们已有的方式去使数据游戏化 00:10:37.821 --> 00:10:39.212 通过使用动画 00:10:39.212 --> 00:10:43.530 以及利用人们会有先入之见这一事实 NOTE Paragraph 00:10:43.530 --> 00:10:47.091 结果是,反应... 00:10:48.328 --> 00:10:50.286 比我所期望的要好 00:10:50.286 --> 00:10:53.445 对我来说运营数据网站 需要持久的雄心 00:10:53.445 --> 00:10:55.123 因为公众有着庞大的需求 NOTE Paragraph 00:10:55.123 --> 00:10:56.901 (观众笑声) NOTE Paragraph 00:10:56.901 --> 00:11:00.329 这个网址包含单词“统计“,"gov" 和"UK" 00:11:00.329 --> 00:11:03.711 这三个是在网址中最不受欢迎的单词 00:11:03.711 --> 00:11:07.710 惊人的是这个网站在晚上 00:11:07.710 --> 00:11:09.847 9点45的时候瘫痪了 00:11:09.847 --> 00:11:13.062 因为人们实际上在基于自愿的基础上 00:11:13.062 --> 00:11:14.595 很积极地利用他们的 00:11:14.595 --> 00:11:16.674 个人时间为我们提供数据 00:11:16.678 --> 00:11:18.985 我很兴奋的看到 00:11:18.985 --> 00:11:22.912 有二十五万人在测试发起的 00:11:22.912 --> 00:11:26.238 48小时之内参与了测试 00:11:26.238 --> 00:11:30.063 并且在网络和社交媒体上 激发了巨大的讨论 00:11:30.063 --> 00:11:32.184 这些讨论大部分被 00:11:32.184 --> 00:11:36.247 在见解偏差中找到乐趣的人们所占据 00:11:36.251 --> 00:11:39.340 对于我来说,在某种程度上没有比这 00:11:39.340 --> 00:11:40.354 更令人欣慰的了 00:11:40.354 --> 00:11:43.588 我也愿意看到人们开始将它发送给政客 00:11:43.588 --> 00:11:46.351 你对你自己声称代表的区域了解多少? NOTE Paragraph 00:11:46.351 --> 00:11:47.437 (观众笑声) NOTE Paragraph 00:11:47.437 --> 00:11:49.127 那么我的演讲要接近尾声了 00:11:49.992 --> 00:11:52.342 回到那两类人 00:11:52.346 --> 00:11:53.733 我很好奇 00:11:53.733 --> 00:11:57.492 擅长数字的人是如何完成这个测试的 00:11:57.492 --> 00:12:00.186 英格兰和威尔士的国家统计学家, 约翰·普令吉尔 00:12:00.186 --> 00:12:02.579 你会觉得他应该做得非常好 00:12:03.524 --> 00:12:06.003 然而他在自己的区域得了44分 NOTE Paragraph 00:12:06.003 --> 00:12:08.495 (观众笑声) NOTE Paragraph 00:12:08.495 --> 00:12:13.438 杰瑞米·拍客斯曼——我得声明 是在喝了一杯酒之后——得了36分 00:12:14.051 --> 00:12:15.542 还不如前面那位 00:12:15.542 --> 00:12:18.757 它展示给大家数字可以启示我们 00:12:18.761 --> 00:12:20.041 可以给我们带来惊讶 NOTE Paragraph 00:12:20.045 --> 00:12:22.034 所以我们常常把统计学 00:12:22.034 --> 00:12:24.100 作为一种不确定性的科学来谈论 00:12:24.100 --> 00:12:25.820 我今天的想法是 00:12:25.820 --> 00:12:28.965 实际上,统计是关于我们自身的科学 00:12:28.965 --> 00:12:31.777 这是为什么我们应该为此感到着迷 NOTE Paragraph 00:12:31.777 --> 00:12:32.991 非常感谢 NOTE Paragraph 00:12:32.991 --> 00:12:35.622 (观众掌声)