[讲师]Adrianna收集了一些关于
不同学校的胜率
以及他们的主教练平均年薪的数据。
收集的是2000年至2011年期间的年薪数据,以百万美元为单位。
然后她创建了以下散点图和趋势线。
这是以百万美元为单位的年薪
和胜率。
在这里,我们有一个教练赚了超过4百万美元,
而且看起来他们赢得了80%以上的比赛。
但你有看这里有个教练,
他的工资略高于
一百五十万美元,
而他们的胜率超过85%。
这些数据点中的每一个点
代表的是一个教练。
这里绘制出了他们的薪水,
或者说是他们的胜率对比他们的薪水。
假设这条直线正确地显示了数据的趋势。
这是一个假设。
这里有一些异常值
与我们的模型离得很远。
而这并不是一个......
它看起是线性的,
这里有一个正的线性相关,
但它排布得并不十分紧密。
这里有一群教练
处于低工资区,
而他们的胜率分布从20%左右
一直到超过60%。
假设这条线正确地显示了数据的趋势,
那么这条线的Y截距是39表示的是什么呢?
如果你信任这个模型的话,
那么Y轴截距为39就表示
这个模型是在说
如果有教练没有薪水,
也就是0美元,
那么他们的胜率,
该模型预计他们会赢得39%的比赛。
这似乎有点不切实际,
因为你会期望大多数教练都能得到一些报酬。
但无论如何,让我们先看看这些选项中的哪一个
正确描述了这一点。
让我看一下这些选项。
平均工资是3900万美元,不对。
我们的图表上没有教练赚到3900万。
平均来说,每增加一百万美元的工资
就会增加39%的胜率。
这种说法与斜率有关,
而这里的斜率绝对不是39。
平均胜率是39%。
我们知道这也不是正确的描述。
该模型表明,
教练薪水为0百万美元的
球队平均胜率约为 39%。
这个描述是最接近
我们刚才所说的:
如果你信任这个模型,
这是一个很大的前提假设。
如果你信任这个模型,
这个模型表示的就是,如果一个球队的教练的薪水为0美元,
那么该球队的胜率将是39%。
按照模型得到了这种说法使你必须对模型持怀疑态度。
这些模型不是完美的。
特别是在极端的情况下,往往会像这个例子一样得到不切实际的结论。
但谁又知道呢?
总之,希望你能觉得这个例子很有用。