[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.11,0:00:03.93,Default,,0000,0000,0000,,♪ [音乐] ♪ Dialogue: 0,0:00:20.88,0:00:22.08,Default,,0000,0000,0000,,- [Thomas Stratmann] 大家好! Dialogue: 0,0:00:22.08,0:00:24.27,Default,,0000,0000,0000,,在接下来的一系列视频中 Dialogue: 0,0:00:24.27,0:00:26.86,Default,,0000,0000,0000,,我们将向你介绍一个\N炫酷的新工具 Dialogue: 0,0:00:26.86,0:00:30.41,Default,,0000,0000,0000,,来帮助你理解数据 Dialogue: 0,0:00:30.41,0:00:31.98,Default,,0000,0000,0000,,那就是“线性回归” Dialogue: 0,0:00:32.88,0:00:34.67,Default,,0000,0000,0000,,假设你有这么一种理论 Dialogue: 0,0:00:34.67,0:00:37.25,Default,,0000,0000,0000,,你发现外貌出众的人 Dialogue: 0,0:00:37.25,0:00:39.07,Default,,0000,0000,0000,,好像总能得到特殊的优待 Dialogue: 0,0:00:39.64,0:00:40.88,Default,,0000,0000,0000,,你在想 Dialogue: 0,0:00:40.88,0:00:43.80,Default,,0000,0000,0000,,“还有什么地方\N也能看到这种现象呢?” Dialogue: 0,0:00:44.13,0:00:45.64,Default,,0000,0000,0000,,对教师来说\N这种现象也存在吗? Dialogue: 0,0:00:45.64,0:00:48.26,Default,,0000,0000,0000,,有没有可能\N外貌出众的老师 Dialogue: 0,0:00:48.26,0:00:50.01,Default,,0000,0000,0000,,也会得到特别优待呢? Dialogue: 0,0:00:50.35,0:00:53.90,Default,,0000,0000,0000,,学生们会不会\N对这些老师更好 Dialogue: 0,0:00:53.90,0:00:57.21,Default,,0000,0000,0000,,给他们打更高的学生评价分? Dialogue: 0,0:00:57.87,0:01:01.76,Default,,0000,0000,0000,,如果确实如此\N外貌对评价分的影响 Dialogue: 0,0:01:01.76,0:01:03.57,Default,,0000,0000,0000,,是很大还是很小呢? Dialogue: 0,0:01:04.16,0:01:07.76,Default,,0000,0000,0000,,假设有位教师刚刚开始\N到一所大学上班 Dialogue: 0,0:01:07.76,0:01:08.76,Default,,0000,0000,0000,,- [背景男声] 老兄,早啊 Dialogue: 0,0:01:08.76,0:01:11.81,Default,,0000,0000,0000,,- 仅从他的外貌\N我们能对他的学生评价分 Dialogue: 0,0:01:11.81,0:01:13.37,Default,,0000,0000,0000,,做出怎样的预测? Dialogue: 0,0:01:13.94,0:01:17.22,Default,,0000,0000,0000,,由于评价分能影响加薪 Dialogue: 0,0:01:17.67,0:01:21.30,Default,,0000,0000,0000,,如果这个理论属实\N老师们可能会 Dialogue: 0,0:01:21.30,0:01:24.70,Default,,0000,0000,0000,,采取一些令人惊讶的手段\N来提高他们的得分 Dialogue: 0,0:01:24.70,0:01:25.73,Default,,0000,0000,0000,,- [Lloyd Christmas] 耶! Dialogue: 0,0:01:25.73,0:01:27.46,Default,,0000,0000,0000,,- 如果你想弄清楚 Dialogue: 0,0:01:27.46,0:01:30.80,Default,,0000,0000,0000,,更出众的外貌是否真的会\N带来更高的评价分 Dialogue: 0,0:01:31.44,0:01:34.45,Default,,0000,0000,0000,,你会怎样检验这个假说呢? Dialogue: 0,0:01:34.96,0:01:36.55,Default,,0000,0000,0000,,你可以收集数据 Dialogue: 0,0:01:36.76,0:01:40.02,Default,,0000,0000,0000,,首先,让学生从1到10 Dialogue: 0,0:01:40.02,0:01:42.08,Default,,0000,0000,0000,,给老师的外貌打分 Dialogue: 0,0:01:42.08,0:01:44.81,Default,,0000,0000,0000,,由此你可以得出\N这位老师的颜值平均分 Dialogue: 0,0:01:45.23,0:01:48.55,Default,,0000,0000,0000,,然后你可以从25名学生处 Dialogue: 0,0:01:48.55,0:01:50.42,Default,,0000,0000,0000,,收集这位老师的教学评价分 Dialogue: 0,0:01:50.42,0:01:53.27,Default,,0000,0000,0000,,我们通过散点图 Dialogue: 0,0:01:53.27,0:01:54.74,Default,,0000,0000,0000,,来同时查看这两个变量 Dialogue: 0,0:01:54.98,0:01:57.42,Default,,0000,0000,0000,,我们用横轴表示外貌 Dialogue: 0,0:01:57.85,0:02:00.59,Default,,0000,0000,0000,,纵轴表示教学评价分 Dialogue: 0,0:02:01.22,0:02:04.90,Default,,0000,0000,0000,,例如,这一点代表着 Peate 教授 Dialogue: 0,0:02:04.90,0:02:06.42,Default,,0000,0000,0000,,- [Bib Fortuna] 你好哇! Dialogue: 0,0:02:06.42,0:02:08.81,Default,,0000,0000,0000,,- 他得到了3分的外貌分 Dialogue: 0,0:02:08.81,0:02:11.87,Default,,0000,0000,0000,,8.425的教学评价分 Dialogue: 0,0:02:12.08,0:02:14.96,Default,,0000,0000,0000,,这边特别靠右的是\NHelmchen 教授 Dialogue: 0,0:02:14.96,0:02:16.80,Default,,0000,0000,0000,,- [Ben Stiller, "Zoolander"]\N帅到不像话! Dialogue: 0,0:02:16.80,0:02:18.72,Default,,0000,0000,0000,,- 他的外貌得分非常高 Dialogue: 0,0:02:18.72,0:02:20.87,Default,,0000,0000,0000,,但评价分没那么高 Dialogue: 0,0:02:21.10,0:02:22.28,Default,,0000,0000,0000,,你能看出规律吗? Dialogue: 0,0:02:22.28,0:02:25.53,Default,,0000,0000,0000,,当我们沿x轴从左向右移动 Dialogue: 0,0:02:25.53,0:02:27.96,Default,,0000,0000,0000,,从难看向好看移动 Dialogue: 0,0:02:27.96,0:02:31.19,Default,,0000,0000,0000,,评价分呈现出上升趋势 Dialogue: 0,0:02:31.87,0:02:35.17,Default,,0000,0000,0000,,对了,我们在这个系列视频中\N使用的数据 Dialogue: 0,0:02:35.17,0:02:38.92,Default,,0000,0000,0000,,不是编造出来的\N而是来自于 Dialogue: 0,0:02:38.92,0:02:40.90,Default,,0000,0000,0000,,在德克萨斯大学做过的\N真实研究 Dialogue: 0,0:02:41.34,0:02:44.48,Default,,0000,0000,0000,,另外你可能不知道\N“pulchritude”只不过是 Dialogue: 0,0:02:44.48,0:02:47.88,Default,,0000,0000,0000,,“颜值”的另一种\N比较高端、学术的说法 Dialogue: 0,0:02:48.40,0:02:49.77,Default,,0000,0000,0000,,有些时候 Dialogue: 0,0:02:49.77,0:02:55.59,Default,,0000,0000,0000,,用散点图很难判断出\N两个变量之间的确切关系 Dialogue: 0,0:02:55.59,0:02:59.10,Default,,0000,0000,0000,,尤其是随着我们\N从左向右移动 Dialogue: 0,0:02:59.10,0:03:01.32,Default,,0000,0000,0000,,数值的波动很大的时候 Dialogue: 0,0:03:02.00,0:03:04.91,Default,,0000,0000,0000,,处理这种波动的一种方法是 Dialogue: 0,0:03:04.91,0:03:08.14,Default,,0000,0000,0000,,画一条直线\N穿过这团数据 Dialogue: 0,0:03:08.14,0:03:09.62,Default,,0000,0000,0000,,让这条直线 Dialogue: 0,0:03:09.62,0:03:12.61,Default,,0000,0000,0000,,尽可能贴切地描述这些数据 Dialogue: 0,0:03:13.30,0:03:17.18,Default,,0000,0000,0000,,专业的说法叫做“线性回归” Dialogue: 0,0:03:17.67,0:03:20.89,Default,,0000,0000,0000,,以后我们会讲到\N这条线是怎么画出来的 Dialogue: 0,0:03:20.89,0:03:22.96,Default,,0000,0000,0000,,不过今天我们可以先假设 Dialogue: 0,0:03:22.96,0:03:26.46,Default,,0000,0000,0000,,这条线已经尽可能地贴合了数据 Dialogue: 0,0:03:27.09,0:03:29.54,Default,,0000,0000,0000,,那么这条线能告诉我们什么呢? Dialogue: 0,0:03:30.07,0:03:32.60,Default,,0000,0000,0000,,首先,我们立刻就能看出 Dialogue: 0,0:03:32.60,0:03:35.36,Default,,0000,0000,0000,,这条线是向上还是向下倾斜 Dialogue: 0,0:03:36.11,0:03:39.83,Default,,0000,0000,0000,,在我们的数据组中\N这条线向上倾斜 Dialogue: 0,0:03:40.79,0:03:42.14,Default,,0000,0000,0000,,这也就验证了 Dialogue: 0,0:03:42.14,0:03:45.59,Default,,0000,0000,0000,,我们之前通过观察散点图\N得出的假说 Dialogue: 0,0:03:46.07,0:03:47.88,Default,,0000,0000,0000,,向上倾斜就意味着 Dialogue: 0,0:03:47.88,0:03:53.03,Default,,0000,0000,0000,,外貌和评价分存在正相关 Dialogue: 0,0:03:53.54,0:03:54.65,Default,,0000,0000,0000,,换句话说 Dialogue: 0,0:03:54.65,0:03:59.47,Default,,0000,0000,0000,,平均说来\N好看的老师得到的评价分更高 Dialogue: 0,0:03:59.77,0:04:03.94,Default,,0000,0000,0000,,其他数据组\N可能显示出更强的正相关 Dialogue: 0,0:04:04.38,0:04:07.42,Default,,0000,0000,0000,,也有可能显示出负相关 Dialogue: 0,0:04:07.86,0:04:10.76,Default,,0000,0000,0000,,也有可能根本没有相关性 Dialogue: 0,0:04:11.16,0:04:13.90,Default,,0000,0000,0000,,线也未必要是直线 Dialogue: 0,0:04:14.39,0:04:17.30,Default,,0000,0000,0000,,必要时可以弯曲\N以便更好贴合数据 Dialogue: 0,0:04:17.77,0:04:21.26,Default,,0000,0000,0000,,这条线也给我们提供了\N一种预测结果的方法 Dialogue: 0,0:04:21.58,0:04:23.78,Default,,0000,0000,0000,,对一个给定的外貌得分 Dialogue: 0,0:04:23.78,0:04:28.43,Default,,0000,0000,0000,,我们可以直接从线上读出\N评价分的预测值 Dialogue: 0,0:04:28.43,0:04:30.23,Default,,0000,0000,0000,,再回头看一下新来的老师 Dialogue: 0,0:04:30.23,0:04:31.30,Default,,0000,0000,0000,,- [Lloyd] 眼熟吗? Dialogue: 0,0:04:31.30,0:04:34.11,Default,,0000,0000,0000,,- 我们可以准确预测出\N他的评价分 Dialogue: 0,0:04:34.68,0:04:36.75,Default,,0000,0000,0000,,你可能想说“等一下!” Dialogue: 0,0:04:37.02,0:04:38.75,Default,,0000,0000,0000,,“我们能相信这个预测吗?” Dialogue: 0,0:04:39.23,0:04:41.66,Default,,0000,0000,0000,,我们的外貌变量 Dialogue: 0,0:04:41.66,0:04:43.52,Default,,0000,0000,0000,,究竟能多么准确地\N预测评价分呢? Dialogue: 0,0:04:44.84,0:04:46.79,Default,,0000,0000,0000,,线性回归给我们提供了 Dialogue: 0,0:04:46.79,0:04:49.77,Default,,0000,0000,0000,,能用来回答这些问题的\N一些实用的方法 Dialogue: 0,0:04:49.77,0:04:52.04,Default,,0000,0000,0000,,我们在以后的视频中\N再来探讨 Dialogue: 0,0:04:52.84,0:04:55.44,Default,,0000,0000,0000,,在得出任何肯定的结论之前 Dialogue: 0,0:04:55.44,0:04:58.34,Default,,0000,0000,0000,,我们还得当心几个陷阱 Dialogue: 0,0:04:58.83,0:05:00.43,Default,,0000,0000,0000,,想象这样一种情况 Dialogue: 0,0:05:00.43,0:05:03.64,Default,,0000,0000,0000,,我们所看到的关联背后 Dialogue: 0,0:05:03.64,0:05:06.90,Default,,0000,0000,0000,,其实是被我们忽略掉的\N第三个变量在起作用 Dialogue: 0,0:05:07.34,0:05:09.96,Default,,0000,0000,0000,,例如课程的难度 Dialogue: 0,0:05:09.96,0:05:11.16,Default,,0000,0000,0000,,可能导致了 Dialogue: 0,0:05:11.16,0:05:15.64,Default,,0000,0000,0000,,外貌得分与教学评价分\N之间的正相关 Dialogue: 0,0:05:16.05,0:05:18.96,Default,,0000,0000,0000,,简单的导论课\N总能得到高评价分 Dialogue: 0,0:05:19.23,0:05:22.97,Default,,0000,0000,0000,,级别更高、更难的课\N容易得到差评 Dialogue: 0,0:05:23.66,0:05:27.67,Default,,0000,0000,0000,,而年轻的老师\N可能会被安排去上导论课 Dialogue: 0,0:05:28.08,0:05:32.10,Default,,0000,0000,0000,,那么如果学生认为\N年轻的老师更有吸引力 Dialogue: 0,0:05:32.10,0:05:34.34,Default,,0000,0000,0000,,外貌得分与教学评价分 Dialogue: 0,0:05:34.34,0:05:37.38,Default,,0000,0000,0000,,就会呈现正相关 Dialogue: 0,0:05:37.86,0:05:40.39,Default,,0000,0000,0000,,但实际上是课程难度 Dialogue: 0,0:05:40.39,0:05:43.54,Default,,0000,0000,0000,,这个被我们忽视了的变量\N在影响着评价分 Dialogue: 0,0:05:43.54,0:05:45.85,Default,,0000,0000,0000,,而不是外貌 Dialogue: 0,0:05:46.35,0:05:49.81,Default,,0000,0000,0000,,在那种情况下\N一切的掩饰都是徒劳 Dialogue: 0,0:05:50.29,0:05:53.62,Default,,0000,0000,0000,,相关性被错误地\N当成了因果关系 Dialogue: 0,0:05:53.62,0:05:54.90,Default,,0000,0000,0000,,- [Lloyd] 等一下… Dialogue: 0,0:05:54.90,0:05:58.17,Default,,0000,0000,0000,,在后面的视频中\N我们会进一步探讨这个问题 Dialogue: 0,0:05:58.92,0:06:02.07,Default,,0000,0000,0000,,另外,会不会有其他重要的变量 Dialogue: 0,0:06:02.07,0:06:05.78,Default,,0000,0000,0000,,同时影响着外貌得分和评价分呢? Dialogue: 0,0:06:06.63,0:06:09.58,Default,,0000,0000,0000,,为了把外貌对评价分的影响\N更清楚地剥离出来 Dialogue: 0,0:06:09.85,0:06:14.58,Default,,0000,0000,0000,,技能,种族,性别\N老师的母语是否为英语 Dialogue: 0,0:06:14.58,0:06:18.99,Default,,0000,0000,0000,,都是你可能需要考虑的因素 Dialogue: 0,0:06:19.41,0:06:21.76,Default,,0000,0000,0000,,等我们讲到复回归 Dialogue: 0,0:06:21.76,0:06:24.48,Default,,0000,0000,0000,,就能把其他\N可能影响这种关联的因素 Dialogue: 0,0:06:24.48,0:06:26.22,Default,,0000,0000,0000,,考虑进去 Dialogue: 0,0:06:26.22,0:06:28.37,Default,,0000,0000,0000,,同时度量外貌 Dialogue: 0,0:06:28.37,0:06:30.74,Default,,0000,0000,0000,,对教学评价的影响 Dialogue: 0,0:06:31.76,0:06:35.51,Default,,0000,0000,0000,,接下来我们要\N动手摆弄摆弄这些数据 Dialogue: 0,0:06:35.51,0:06:39.07,Default,,0000,0000,0000,,从而更好地理解\N这条线的含义 Dialogue: 0,0:06:41.17,0:06:42.44,Default,,0000,0000,0000,,- [讲解员] 祝贺你! Dialogue: 0,0:06:42.44,0:06:45.25,Default,,0000,0000,0000,,你离成为数据忍者\N又近了一步! Dialogue: 0,0:06:45.57,0:06:47.14,Default,,0000,0000,0000,,不过,要想熟练掌握所学内容 Dialogue: 0,0:06:47.14,0:06:48.70,Default,,0000,0000,0000,,你还需要做些习题 Dialogue: 0,0:06:48.70,0:06:50.40,Default,,0000,0000,0000,,来磨练技艺 Dialogue: 0,0:06:50.86,0:06:53.98,Default,,0000,0000,0000,,准备好迎接下一项任务了吗?\N请点击“下一个视频” Dialogue: 0,0:06:54.31,0:06:55.36,Default,,0000,0000,0000,,还在观看? Dialogue: 0,0:06:55.60,0:06:58.32,Default,,0000,0000,0000,,想要理解数据\N进而理解你的世界 Dialogue: 0,0:06:58.32,0:07:01.64,Default,,0000,0000,0000,,请观看边际革命大学的\N其他热门视频 Dialogue: 0,0:07:02.00,0:07:05.90,Default,,0000,0000,0000,,♪ [音乐] ♪