0:00:00.909,0:00:02.250 [讲师]Adrianna收集了一些关于 0:00:02.250,0:00:04.249 不同学校的胜率 0:00:04.249,0:00:07.968 以及他们的主教练平均年薪的数据。 0:00:07.968,0:00:12.225 收集的是2000年至2011年期间的年薪数据,以百万美元为单位。 0:00:12.225,0:00:15.619 然后她创建了以下散点图和趋势线。 0:00:15.619,0:00:17.604 这是以百万美元为单位的年薪 0:00:17.604,0:00:19.936 和胜率。 0:00:19.936,0:00:24.056 在这里,我们有一个教练赚了超过4百万美元, 0:00:24.056,0:00:28.413 而且看起来他们赢得了80%以上的比赛。 0:00:28.413,0:00:29.831 但你有看这里有个教练, 0:00:29.831,0:00:31.313 他的工资略高于 0:00:31.313,0:00:32.823 一百五十万美元, 0:00:32.823,0:00:35.451 而他们的胜率超过85%。 0:00:35.451,0:00:38.119 这些数据点中的每一个点 0:00:38.119,0:00:39.576 代表的是一个教练。 0:00:39.576,0:00:41.701 这里绘制出了他们的薪水, 0:00:41.701,0:00:44.770 或者说是他们的胜率对比他们的薪水。 0:00:44.770,0:00:48.326 假设这条直线正确地显示了数据的趋势。 0:00:48.326,0:00:49.625 这是一个假设。 0:00:49.625,0:00:51.070 这里有一些异常值 0:00:51.070,0:00:53.508 与我们的模型离得很远。 0:00:53.508,0:00:54.679 而这并不是一个...... 0:00:54.679,0:00:55.911 它看起是线性的, 0:00:55.911,0:00:58.050 这里有一个正的线性相关, 0:00:58.050,0:00:59.582 但它排布得并不十分紧密。 0:00:59.582,0:01:01.121 这里有一群教练 0:01:01.121,0:01:03.781 处于低工资区, 0:01:03.781,0:01:05.875 而他们的胜率分布从20%左右 0:01:05.875,0:01:07.483 一直到超过60%。 0:01:07.483,0:01:10.209 假设这条线正确地显示了数据的趋势, 0:01:10.209,0:01:15.169 那么这条线的Y截距是39表示的是什么呢? 0:01:15.169,0:01:16.786 如果你信任这个模型的话, 0:01:16.786,0:01:19.784 那么Y轴截距为39就表示 0:01:19.784,0:01:22.357 这个模型是在说 0:01:22.357,0:01:24.437 如果有教练没有薪水, 0:01:24.437,0:01:26.583 也就是0美元, 0:01:26.583,0:01:28.054 那么他们的胜率, 0:01:28.054,0:01:31.666 该模型预计他们会赢得39%的比赛。 0:01:31.666,0:01:33.230 这似乎有点不切实际, 0:01:33.230,0:01:36.072 因为你会期望大多数教练都能得到一些报酬。 0:01:36.072,0:01:37.760 但无论如何,让我们先看看这些选项中的哪一个 0:01:37.760,0:01:40.323 正确描述了这一点。 0:01:40.323,0:01:42.984 让我看一下这些选项。 0:01:42.984,0:01:46.124 平均工资是3900万美元,不对。 0:01:46.124,0:01:48.108 我们的图表上没有教练赚到3900万。 0:01:48.108,0:01:50.350 平均来说,每增加一百万美元的工资 0:01:50.350,0:01:52.765 就会增加39%的胜率。 0:01:52.765,0:01:56.686 这种说法与斜率有关, 0:01:56.686,0:01:58.735 而这里的斜率绝对不是39。 0:01:58.735,0:02:01.353 平均胜率是39%。 0:02:01.353,0:02:02.692 我们知道这也不是正确的描述。 0:02:02.692,0:02:05.248 该模型表明, 0:02:05.248,0:02:06.781 教练薪水为0百万美元的 0:02:06.781,0:02:09.971 球队平均胜率约为 39%。 0:02:09.971,0:02:12.717 这个描述是最接近 0:02:12.717,0:02:14.264 我们刚才所说的: 0:02:14.264,0:02:15.740 如果你信任这个模型, 0:02:15.740,0:02:17.285 这是一个很大的前提假设。 0:02:17.285,0:02:19.452 如果你信任这个模型, 0:02:20.916,0:02:23.375 这个模型表示的就是,如果一个球队的教练的薪水为0美元, 0:02:23.375,0:02:24.966 那么该球队的胜率将是39%。 0:02:24.966,0:02:27.446 按照模型得到了这种说法使你必须对模型持怀疑态度。 0:02:27.446,0:02:28.688 这些模型不是完美的。 0:02:28.688,0:02:31.249 特别是在极端的情况下,往往会像这个例子一样得到不切实际的结论。 0:02:31.249,0:02:32.247 但谁又知道呢? 0:02:32.247,0:02:34.873 总之,希望你能觉得这个例子很有用。