[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.11,0:00:03.93,Default,,0000,0000,0000,,♪ [音乐] ♪ Dialogue: 0,0:00:11.53,0:00:14.53,Default,,0000,0000,0000,,理解数据 Dialogue: 0,0:00:15.79,0:00:18.79,Default,,0000,0000,0000,,线性回归简介 Dialogue: 0,0:00:20.88,0:00:22.08,Default,,0000,0000,0000,,- [Thomas Stratmann] 大家好! Dialogue: 0,0:00:22.08,0:00:24.27,Default,,0000,0000,0000,,在接下来的一系列视频中 Dialogue: 0,0:00:24.27,0:00:27.60,Default,,0000,0000,0000,,我们将向你介绍一个\N炫酷的新工具 Dialogue: 0,0:00:27.60,0:00:30.41,Default,,0000,0000,0000,,来帮助你理解数据 Dialogue: 0,0:00:30.41,0:00:32.69,Default,,0000,0000,0000,,那就是“线性回归” Dialogue: 0,0:00:32.88,0:00:34.67,Default,,0000,0000,0000,,假设你有这么一种理论 Dialogue: 0,0:00:34.67,0:00:37.25,Default,,0000,0000,0000,,你发现外貌出众的人 Dialogue: 0,0:00:37.25,0:00:39.57,Default,,0000,0000,0000,,好像总能得到特殊的优待 Dialogue: 0,0:00:39.57,0:00:40.72,Default,,0000,0000,0000,,你在想 Dialogue: 0,0:00:40.72,0:00:44.14,Default,,0000,0000,0000,,“还有什么地方\N也能看到这种现象呢?” Dialogue: 0,0:00:44.14,0:00:46.06,Default,,0000,0000,0000,,对教授来说\N这种现象也存在吗? Dialogue: 0,0:00:46.06,0:00:48.26,Default,,0000,0000,0000,,有没有可能\N外貌出众的老师 Dialogue: 0,0:00:48.26,0:00:50.40,Default,,0000,0000,0000,,也会得到特别优待呢? Dialogue: 0,0:00:50.40,0:00:53.90,Default,,0000,0000,0000,,学生们会不会\N对这些老师更好 Dialogue: 0,0:00:53.90,0:00:57.49,Default,,0000,0000,0000,,给他们打更高的\N学生评价分? Dialogue: 0,0:00:57.87,0:00:59.36,Default,,0000,0000,0000,,如果确实如此 Dialogue: 0,0:00:59.36,0:01:01.76,Default,,0000,0000,0000,,外貌对评价分的影响 Dialogue: 0,0:01:01.76,0:01:03.87,Default,,0000,0000,0000,,是很大还是很小呢? Dialogue: 0,0:01:04.16,0:01:07.76,Default,,0000,0000,0000,,假设有位教师刚刚开始\N到一所大学上班 Dialogue: 0,0:01:07.76,0:01:08.84,Default,,0000,0000,0000,,- [背景男声] 同学们,早啊 Dialogue: 0,0:01:08.84,0:01:12.10,Default,,0000,0000,0000,,- 仅从他的外貌\N我们能对他的学生评价分 Dialogue: 0,0:01:12.10,0:01:13.95,Default,,0000,0000,0000,,做出怎样的预测? Dialogue: 0,0:01:13.95,0:01:17.46,Default,,0000,0000,0000,,由于评价分会影响到加薪 Dialogue: 0,0:01:17.46,0:01:19.33,Default,,0000,0000,0000,,如果这个理论属实\N Dialogue: 0,0:01:19.33,0:01:22.100,Default,,0000,0000,0000,,老师们可能会\N采取一些令人惊讶的手段 Dialogue: 0,0:01:22.100,0:01:24.60,Default,,0000,0000,0000,,来提高他们的得分 Dialogue: 0,0:01:24.60,0:01:25.73,Default,,0000,0000,0000,,- [Lloyd Christmas] 耶! Dialogue: 0,0:01:25.73,0:01:27.46,Default,,0000,0000,0000,,- 如果你想弄清楚 Dialogue: 0,0:01:27.46,0:01:31.46,Default,,0000,0000,0000,,更出众的外貌是否真的会\N带来更高的评价分 Dialogue: 0,0:01:31.46,0:01:34.45,Default,,0000,0000,0000,,你会怎样\N检验这个假说呢? Dialogue: 0,0:01:34.96,0:01:36.76,Default,,0000,0000,0000,,你可以收集数据 Dialogue: 0,0:01:36.76,0:01:39.86,Default,,0000,0000,0000,,首先,让学生从1到10 Dialogue: 0,0:01:39.86,0:01:41.59,Default,,0000,0000,0000,,给老师的外貌打分 Dialogue: 0,0:01:41.59,0:01:45.24,Default,,0000,0000,0000,,由此你可以得出\N这位老师的颜值平均分 Dialogue: 0,0:01:45.24,0:01:48.12,Default,,0000,0000,0000,,然后你可以从\N25名学生那里 Dialogue: 0,0:01:48.12,0:01:50.42,Default,,0000,0000,0000,,收集这位老师的\N教学评价分 Dialogue: 0,0:01:50.42,0:01:52.58,Default,,0000,0000,0000,,我们通过散点图 Dialogue: 0,0:01:52.58,0:01:54.74,Default,,0000,0000,0000,,来观察这两个变量 Dialogue: 0,0:01:54.98,0:01:57.42,Default,,0000,0000,0000,,我们用横轴表示外貌 Dialogue: 0,0:01:57.85,0:02:00.59,Default,,0000,0000,0000,,纵轴表示教学评价分 Dialogue: 0,0:02:01.22,0:02:04.90,Default,,0000,0000,0000,,例如,这一点代表着\NPeate 教授 Dialogue: 0,0:02:04.90,0:02:06.42,Default,,0000,0000,0000,,- [Bib Fortuna] 你好哇! Dialogue: 0,0:02:06.42,0:02:08.81,Default,,0000,0000,0000,,- 他得到了3分的外貌分 Dialogue: 0,0:02:08.81,0:02:11.87,Default,,0000,0000,0000,,8.425的教学评价分 Dialogue: 0,0:02:12.08,0:02:14.96,Default,,0000,0000,0000,,这边特别靠右的是\NHelmchen 教授 Dialogue: 0,0:02:14.96,0:02:16.80,Default,,0000,0000,0000,,- [Ben Stiller, "Zoolander"]\N帅到不像话! Dialogue: 0,0:02:16.80,0:02:18.72,Default,,0000,0000,0000,,- 他的外貌得分非常高 Dialogue: 0,0:02:18.72,0:02:21.13,Default,,0000,0000,0000,,但教学评价分却很低 Dialogue: 0,0:02:21.13,0:02:22.39,Default,,0000,0000,0000,,你能看出规律吗? Dialogue: 0,0:02:22.39,0:02:25.53,Default,,0000,0000,0000,,当我们沿x轴从左向右移动 Dialogue: 0,0:02:25.53,0:02:27.96,Default,,0000,0000,0000,,从难看向好看移动 Dialogue: 0,0:02:27.96,0:02:31.19,Default,,0000,0000,0000,,评价分呈现出上升趋势 Dialogue: 0,0:02:31.87,0:02:35.57,Default,,0000,0000,0000,,对了,我们在这个系列视频中\N使用的数据 Dialogue: 0,0:02:35.57,0:02:37.10,Default,,0000,0000,0000,,不是编造出来的\N Dialogue: 0,0:02:37.10,0:02:41.39,Default,,0000,0000,0000,,而是来自于德克萨斯大学的\N真实调查 Dialogue: 0,0:02:41.39,0:02:44.48,Default,,0000,0000,0000,,另外你可能不知道\N“pulchritude”只不过是 Dialogue: 0,0:02:44.48,0:02:48.41,Default,,0000,0000,0000,,“颜值”的另一种\N比较高端、学术的说法 Dialogue: 0,0:02:48.41,0:02:49.56,Default,,0000,0000,0000,,有些时候 Dialogue: 0,0:02:49.56,0:02:55.59,Default,,0000,0000,0000,,用散点图很难判断出\N两个变量之间的确切关系 Dialogue: 0,0:02:55.59,0:02:58.81,Default,,0000,0000,0000,,尤其是随着我们\N从左向右移动 Dialogue: 0,0:02:58.81,0:03:01.100,Default,,0000,0000,0000,,数值的波动很大的时候 Dialogue: 0,0:03:02.00,0:03:04.91,Default,,0000,0000,0000,,对付这种波动的\N一种方法是 Dialogue: 0,0:03:04.91,0:03:08.14,Default,,0000,0000,0000,,画一条直线\N穿过这团数据 Dialogue: 0,0:03:08.14,0:03:09.62,Default,,0000,0000,0000,,让这条直线 Dialogue: 0,0:03:09.62,0:03:12.97,Default,,0000,0000,0000,,尽可能贴切地描述这些数据 Dialogue: 0,0:03:13.30,0:03:17.18,Default,,0000,0000,0000,,专业的说法叫做“线性回归” Dialogue: 0,0:03:17.67,0:03:20.89,Default,,0000,0000,0000,,以后我们会讲到\N这条线是怎么画出来的 Dialogue: 0,0:03:20.89,0:03:22.96,Default,,0000,0000,0000,,不过今天我们可以先假设 Dialogue: 0,0:03:22.96,0:03:26.85,Default,,0000,0000,0000,,这条线已经尽可能\N贴近数据了 Dialogue: 0,0:03:27.09,0:03:30.08,Default,,0000,0000,0000,,那么这条线能\N告诉我们什么呢? Dialogue: 0,0:03:30.08,0:03:32.60,Default,,0000,0000,0000,,首先,我们立刻就能看出 Dialogue: 0,0:03:32.60,0:03:35.36,Default,,0000,0000,0000,,这条线是向上还是向下倾斜 Dialogue: 0,0:03:36.11,0:03:39.83,Default,,0000,0000,0000,,在我们的数据组中\N这条线向上倾斜 Dialogue: 0,0:03:40.79,0:03:42.14,Default,,0000,0000,0000,,这也就验证了 Dialogue: 0,0:03:42.14,0:03:46.10,Default,,0000,0000,0000,,我们之前通过观察散点图\N得出的假说 Dialogue: 0,0:03:46.10,0:03:47.88,Default,,0000,0000,0000,,向上倾斜意味着 Dialogue: 0,0:03:47.88,0:03:53.03,Default,,0000,0000,0000,,外貌和评价分存在正相关 Dialogue: 0,0:03:53.54,0:03:54.65,Default,,0000,0000,0000,,换句话说 Dialogue: 0,0:03:54.65,0:03:55.74,Default,,0000,0000,0000,,平均说来 Dialogue: 0,0:03:55.74,0:03:59.77,Default,,0000,0000,0000,,好看的老师\N得到的评价分更高 Dialogue: 0,0:03:59.77,0:04:04.40,Default,,0000,0000,0000,,其他数据组\N可能显示出更强的正相关 Dialogue: 0,0:04:04.40,0:04:07.42,Default,,0000,0000,0000,,也有可能显示出负相关 Dialogue: 0,0:04:07.86,0:04:10.76,Default,,0000,0000,0000,,也有可能根本没有相关性 Dialogue: 0,0:04:11.16,0:04:13.90,Default,,0000,0000,0000,,线也未必都是直线 Dialogue: 0,0:04:14.39,0:04:17.81,Default,,0000,0000,0000,,必要时可以弯曲\N以便更好贴合数据 Dialogue: 0,0:04:17.81,0:04:21.60,Default,,0000,0000,0000,,这条线也给我们提供了\N一种预测结果的方法 Dialogue: 0,0:04:21.60,0:04:23.70,Default,,0000,0000,0000,,对一个给定的外貌得分 Dialogue: 0,0:04:23.70,0:04:28.43,Default,,0000,0000,0000,,我们可以直接从线上读出\N评价分的预测值 Dialogue: 0,0:04:28.43,0:04:30.23,Default,,0000,0000,0000,,再回头看一下新来的老师 Dialogue: 0,0:04:30.23,0:04:31.30,Default,,0000,0000,0000,,- [Lloyd] 眼熟吗? Dialogue: 0,0:04:31.30,0:04:34.11,Default,,0000,0000,0000,,- 我们可以准确预测出\N他的评价分 Dialogue: 0,0:04:34.68,0:04:36.88,Default,,0000,0000,0000,,你可能想说“等一下!” Dialogue: 0,0:04:36.88,0:04:38.75,Default,,0000,0000,0000,,“我们能相信这个预测吗?” Dialogue: 0,0:04:39.23,0:04:40.76,Default,,0000,0000,0000,,颜值这个变量 Dialogue: 0,0:04:40.76,0:04:44.46,Default,,0000,0000,0000,,究竟能多么准确地\N预测评价分呢? Dialogue: 0,0:04:44.84,0:04:46.53,Default,,0000,0000,0000,,线性回归给我们提供了 Dialogue: 0,0:04:46.53,0:04:49.77,Default,,0000,0000,0000,,能用来回答这些问题的\N一些实用的方法 Dialogue: 0,0:04:49.77,0:04:52.04,Default,,0000,0000,0000,,我们在以后的视频中\N再来探讨 Dialogue: 0,0:04:52.84,0:04:55.44,Default,,0000,0000,0000,,在得出任何\N肯定的结论之前 Dialogue: 0,0:04:55.44,0:04:58.34,Default,,0000,0000,0000,,我们还得当心几个陷阱 Dialogue: 0,0:04:58.83,0:05:00.43,Default,,0000,0000,0000,,想象这样一种情况 Dialogue: 0,0:05:00.43,0:05:02.74,Default,,0000,0000,0000,,我们所看到的关联背后 Dialogue: 0,0:05:02.74,0:05:07.45,Default,,0000,0000,0000,,其实是被我们忽略掉的\N第三个变量在起作用 Dialogue: 0,0:05:07.45,0:05:09.96,Default,,0000,0000,0000,,例如课程的难度 Dialogue: 0,0:05:09.96,0:05:11.16,Default,,0000,0000,0000,,可能导致了 Dialogue: 0,0:05:11.16,0:05:15.64,Default,,0000,0000,0000,,外貌得分与教学评价分\N之间的正相关 Dialogue: 0,0:05:16.05,0:05:19.26,Default,,0000,0000,0000,,教简单的导论课的老师\N总能得到高评价分 Dialogue: 0,0:05:19.26,0:05:23.38,Default,,0000,0000,0000,,教级别更高、更难的课的老师\N就容易得到差评 Dialogue: 0,0:05:23.66,0:05:28.09,Default,,0000,0000,0000,,而年轻的老师\N可能会被安排去上导论课 Dialogue: 0,0:05:28.09,0:05:32.56,Default,,0000,0000,0000,,那么如果学生认为\N年轻的老师更有吸引力 Dialogue: 0,0:05:32.56,0:05:34.86,Default,,0000,0000,0000,,外貌得分与教学评价分 Dialogue: 0,0:05:34.86,0:05:37.38,Default,,0000,0000,0000,,就会呈现正相关 Dialogue: 0,0:05:37.86,0:05:42.31,Default,,0000,0000,0000,,但实际上是课程难度\N这个被我们忽视了的变量 Dialogue: 0,0:05:42.31,0:05:43.100,Default,,0000,0000,0000,,在影响着评价分 Dialogue: 0,0:05:43.100,0:05:45.85,Default,,0000,0000,0000,,而不是外貌 Dialogue: 0,0:05:46.35,0:05:50.37,Default,,0000,0000,0000,,在那种情况下\N一切的美化打扮都是徒劳的 Dialogue: 0,0:05:50.37,0:05:53.62,Default,,0000,0000,0000,,相关性被错误地\N当成了因果关系 Dialogue: 0,0:05:53.62,0:05:54.90,Default,,0000,0000,0000,,- [Lloyd] 等一下… Dialogue: 0,0:05:54.90,0:05:58.17,Default,,0000,0000,0000,,在后面的视频中\N我们会进一步探讨这个问题 Dialogue: 0,0:05:58.92,0:06:02.07,Default,,0000,0000,0000,,另外,会不会有其他重要的变量 Dialogue: 0,0:06:02.07,0:06:06.15,Default,,0000,0000,0000,,同时影响着\N外貌得分和评价分呢? Dialogue: 0,0:06:06.63,0:06:09.92,Default,,0000,0000,0000,,为了更清晰地分辨\N外貌对评价分的影响 Dialogue: 0,0:06:09.92,0:06:14.58,Default,,0000,0000,0000,,像技术,种族,性别\N英语是不是母语 Dialogue: 0,0:06:14.58,0:06:18.99,Default,,0000,0000,0000,,都可能是你需要考虑的因素 Dialogue: 0,0:06:19.41,0:06:21.38,Default,,0000,0000,0000,,等我们讲到多元回归时 Dialogue: 0,0:06:21.38,0:06:23.03,Default,,0000,0000,0000,,就能把其他\N Dialogue: 0,0:06:23.03,0:06:26.74,Default,,0000,0000,0000,,可能影响\N这种相关性的因素考虑进去 Dialogue: 0,0:06:26.74,0:06:28.37,Default,,0000,0000,0000,,同时度量外貌 Dialogue: 0,0:06:28.37,0:06:30.74,Default,,0000,0000,0000,,对教学评价的影响 Dialogue: 0,0:06:31.76,0:06:35.33,Default,,0000,0000,0000,,下节课,我们要\N亲自分析一下这些数据 Dialogue: 0,0:06:35.33,0:06:39.07,Default,,0000,0000,0000,,从而更好地理解\N这条线的含义 Dialogue: 0,0:06:41.17,0:06:42.44,Default,,0000,0000,0000,,- [讲解员] 祝贺你! Dialogue: 0,0:06:42.44,0:06:45.25,Default,,0000,0000,0000,,你离成为数据'忍者"\N又近了一步! Dialogue: 0,0:06:45.57,0:06:47.14,Default,,0000,0000,0000,,不过,要想熟练掌握所学内容 Dialogue: 0,0:06:47.14,0:06:48.70,Default,,0000,0000,0000,,你还需要做些习题 Dialogue: 0,0:06:48.70,0:06:50.40,Default,,0000,0000,0000,,来磨练技艺 Dialogue: 0,0:06:50.86,0:06:53.98,Default,,0000,0000,0000,,准备好迎接下一个挑战了吗?\N请点击“下一个视频” Dialogue: 0,0:06:54.31,0:06:55.36,Default,,0000,0000,0000,,还在观看? Dialogue: 0,0:06:55.60,0:06:58.32,Default,,0000,0000,0000,,请观看边际革命大学的\N其他热门视频 Dialogue: 0,0:06:58.32,0:07:01.64,Default,,0000,0000,0000,,不仅理解数据\N而且理解你的世界 Dialogue: 0,0:07:02.00,0:07:05.90,Default,,0000,0000,0000,,♪ [音乐] ♪