[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.25,0:00:03.83,Default,,0000,0000,0000,,♪[音乐]♪ Dialogue: 0,0:00:11.40,0:00:14.40,Default,,0000,0000,0000,,理解数据 Dialogue: 0,0:00:15.61,0:00:18.14,Default,,0000,0000,0000,,- [Thomas Stratmann] \N让我们深入了解一下 Dialogue: 0,0:00:18.14,0:00:21.43,Default,,0000,0000,0000,,线性回归的这条线\N告诉了我们什么信息 Dialogue: 0,0:00:21.43,0:00:23.71,Default,,0000,0000,0000,,为此,让我先介绍一下 Dialogue: 0,0:00:23.71,0:00:26.70,Default,,0000,0000,0000,,我们需要使用的数据工具 Dialogue: 0,0:00:27.14,0:00:28.36,Default,,0000,0000,0000,,将页面向下滚动 Dialogue: 0,0:00:28.36,0:00:30.47,Default,,0000,0000,0000,,在视频下方会看到此工具 Dialogue: 0,0:00:30.83,0:00:33.44,Default,,0000,0000,0000,,除了观看本课程的视频 Dialogue: 0,0:00:33.89,0:00:36.85,Default,,0000,0000,0000,,你可以按照自己的节奏\N来摆弄那些数据 Dialogue: 0,0:00:37.65,0:00:39.13,Default,,0000,0000,0000,,让我快速带你们看一下 Dialogue: 0,0:00:39.63,0:00:42.16,Default,,0000,0000,0000,,这里有几个选项标签 Dialogue: 0,0:00:42.16,0:00:44.95,Default,,0000,0000,0000,,在这个视频中\N我们先涉及两个标签—— Dialogue: 0,0:00:44.95,0:00:47.76,Default,,0000,0000,0000,,汇总统计标签\N和公式选项标签 Dialogue: 0,0:00:48.32,0:00:49.94,Default,,0000,0000,0000,,如果你还记得\N Dialogue: 0,0:00:49.94,0:00:53.08,Default,,0000,0000,0000,,我们正在讨论老师的颜值 Dialogue: 0,0:00:53.08,0:00:56.40,Default,,0000,0000,0000,,与学生给他们的评估分\N之间的关系 Dialogue: 0,0:00:56.81,0:00:59.64,Default,,0000,0000,0000,,点击汇总统计标签\N图表展示一目了然: Dialogue: 0,0:00:59.64,0:01:02.58,Default,,0000,0000,0000,,数据中每个变量的值是多少 Dialogue: 0,0:01:02.58,0:01:05.23,Default,,0000,0000,0000,,以及它们是如何分布的 Dialogue: 0,0:01:05.45,0:01:07.77,Default,,0000,0000,0000,,例如,让我们来看一下 Dialogue: 0,0:01:07.77,0:01:10.45,Default,,0000,0000,0000,,数据组中\N颜值分数的分布情况 Dialogue: 0,0:01:10.45,0:01:15.07,Default,,0000,0000,0000,,在最高10分的情况下\N大部分人得了3分或4分 Dialogue: 0,0:01:15.07,0:01:16.36,Default,,0000,0000,0000,,妈呀! Dialogue: 0,0:01:16.36,0:01:19.71,Default,,0000,0000,0000,,现在,让我们来看看\N评估分数的分布 Dialogue: 0,0:01:19.71,0:01:22.85,Default,,0000,0000,0000,,对教授们来说\N这看起来好多了 Dialogue: 0,0:01:22.85,0:01:25.88,Default,,0000,0000,0000,,因为很多人落在了高分段 Dialogue: 0,0:01:26.34,0:01:30.62,Default,,0000,0000,0000,,如果你点击公式选项标签\N你会看到散点图 Dialogue: 0,0:01:30.62,0:01:33.22,Default,,0000,0000,0000,,横轴上是颜值分数 Dialogue: 0,0:01:33.62,0:01:36.50,Default,,0000,0000,0000,,纵轴上是评估分数 Dialogue: 0,0:01:37.34,0:01:39.36,Default,,0000,0000,0000,,如果鼠标在\N任意一点悬停 Dialogue: 0,0:01:39.36,0:01:42.64,Default,,0000,0000,0000,,你将看到那个老师的颜值分 Dialogue: 0,0:01:42.64,0:01:46.40,Default,,0000,0000,0000,,和与之对应的评估分 Dialogue: 0,0:01:46.83,0:01:49.83,Default,,0000,0000,0000,,你可以点击这里\N来添加回归线 Dialogue: 0,0:01:50.16,0:01:51.81,Default,,0000,0000,0000,,为了更好地理解回归线 Dialogue: 0,0:01:51.81,0:01:54.76,Default,,0000,0000,0000,,让我们花点儿时间\N回顾一下它的表达式 Dialogue: 0,0:01:55.18,0:01:59.15,Default,,0000,0000,0000,,通常写为:y = b + mx Dialogue: 0,0:01:59.50,0:02:02.08,Default,,0000,0000,0000,,你可能在数学课上见过它 Dialogue: 0,0:02:02.72,0:02:05.46,Default,,0000,0000,0000,,“x”被称为解释变量 Dialogue: 0,0:02:06.27,0:02:09.97,Default,,0000,0000,0000,,在我们的数据组中\Nx代表颜值分 Dialogue: 0,0:02:10.49,0:02:13.94,Default,,0000,0000,0000,,我们用它来解释y的值 Dialogue: 0,0:02:13.94,0:02:16.45,Default,,0000,0000,0000,,y又被称为“响应变量” Dialogue: 0,0:02:17.48,0:02:20.63,Default,,0000,0000,0000,,在我们的例子里\N就是学生给的评估分 Dialogue: 0,0:02:20.95,0:02:23.32,Default,,0000,0000,0000,,所以,在颜值分发生变化时 Dialogue: 0,0:02:23.32,0:02:25.61,Default,,0000,0000,0000,,学生评估分会随之变化 Dialogue: 0,0:02:26.56,0:02:29.34,Default,,0000,0000,0000,,“b”通常被称为y轴截距 Dialogue: 0,0:02:29.59,0:02:32.02,Default,,0000,0000,0000,,“m”是这条线的斜率 Dialogue: 0,0:02:32.84,0:02:37.79,Default,,0000,0000,0000,,在线性回归中\N那个公式通常会写成这样: Dialogue: 0,0:02:39.30,0:02:40.74,Default,,0000,0000,0000,,响应变量 Dialogue: 0,0:02:40.74,0:02:43.34,Default,,0000,0000,0000,,也就是学生给的评估分 Dialogue: 0,0:02:43.34,0:02:46.02,Default,,0000,0000,0000,,等于y轴截距加上 Dialogue: 0,0:02:46.02,0:02:49.11,Default,,0000,0000,0000,,斜率乘以解释变量 Dialogue: 0,0:02:49.58,0:02:51.16,Default,,0000,0000,0000,,在这里便是颜值分 Dialogue: 0,0:02:52.31,0:02:54.50,Default,,0000,0000,0000,,让我们在数据组中\N找出这些对应的值 Dialogue: 0,0:02:54.97,0:02:56.84,Default,,0000,0000,0000,,让我们在这里停一下 Dialogue: 0,0:02:57.18,0:02:58.75,Default,,0000,0000,0000,,请找出线性回归的 Dialogue: 0,0:02:58.75,0:03:00.99,Default,,0000,0000,0000,,斜率和y-截距值 Dialogue: 0,0:03:00.99,0:03:03.12,Default,,0000,0000,0000,,记下来,然后继续观看 Dialogue: 0,0:03:03.33,0:03:04.62,Default,,0000,0000,0000,,♪ [音乐] ♪ Dialogue: 0,0:03:04.79,0:03:07.01,Default,,0000,0000,0000,,这是你要找的答案 Dialogue: 0,0:03:07.01,0:03:08.58,Default,,0000,0000,0000,,你应该已经得出了 Dialogue: 0,0:03:08.58,0:03:11.32,Default,,0000,0000,0000,,斜率和y轴截距的值了 Dialogue: 0,0:03:11.63,0:03:13.53,Default,,0000,0000,0000,,通常,在线性回归中\N Dialogue: 0,0:03:13.53,0:03:17.49,Default,,0000,0000,0000,,我们关心的不是y轴截距 Dialogue: 0,0:03:17.49,0:03:19.94,Default,,0000,0000,0000,,而是斜率的值 Dialogue: 0,0:03:20.50,0:03:21.78,Default,,0000,0000,0000,,斜率告诉我们 Dialogue: 0,0:03:21.78,0:03:25.18,Default,,0000,0000,0000,,当解释变量的值\N增加1个单位时 Dialogue: 0,0:03:25.18,0:03:28.05,Default,,0000,0000,0000,,响应变量的值会向哪个方向 Dialogue: 0,0:03:28.05,0:03:31.06,Default,,0000,0000,0000,,发生多大的变化 Dialogue: 0,0:03:32.17,0:03:35.96,Default,,0000,0000,0000,,掌握了斜率的值\N我们可以做些好玩的事儿 Dialogue: 0,0:03:35.96,0:03:36.100,Default,,0000,0000,0000,,例如—— Dialogue: 0,0:03:36.100,0:03:38.69,Default,,0000,0000,0000,,如果把一个老师的颜值分 Dialogue: 0,0:03:38.69,0:03:41.82,Default,,0000,0000,0000,,从2变到3会怎样呢? Dialogue: 0,0:03:41.98,0:03:44.95,Default,,0000,0000,0000,,她的评估分会提高多少? Dialogue: 0,0:03:44.95,0:03:48.21,Default,,0000,0000,0000,,我们可以从预测模型中\N直接估算出变化 Dialogue: 0,0:03:48.68,0:03:51.12,Default,,0000,0000,0000,,我们把她的颜值分加了1分 Dialogue: 0,0:03:51.12,0:03:55.07,Default,,0000,0000,0000,,很简单——\N评价分的变化等于斜率值 0.2 Dialogue: 0,0:03:55.33,0:03:57.49,Default,,0000,0000,0000,,如果把她的颜值分提高一倍 Dialogue: 0,0:03:57.49,0:04:00.86,Default,,0000,0000,0000,,从2增加4,又会如何呢? Dialogue: 0,0:04:03.18,0:04:06.62,Default,,0000,0000,0000,,现在,我们用\N解释变量的变化值2 Dialogue: 0,0:04:06.62,0:04:09.64,Default,,0000,0000,0000,,乘以斜率0.2 Dialogue: 0,0:04:09.64,0:04:13.22,Default,,0000,0000,0000,,求得评估分的预期变化值 Dialogue: 0,0:04:13.70,0:04:17.51,Default,,0000,0000,0000,,所以,当一位老师的\N颜值分增加2个单位 Dialogue: 0,0:04:17.51,0:04:21.63,Default,,0000,0000,0000,,我们预测她的\N评估分会提高0.4 Dialogue: 0,0:04:22.28,0:04:26.79,Default,,0000,0000,0000,,我们可以通过阅读回归线\N得到同样的结果 Dialogue: 0,0:04:26.79,0:04:32.35,Default,,0000,0000,0000,,如果从2分开始\N我们会看到评估分约为7.5分 Dialogue: 0,0:04:32.35,0:04:34.69,Default,,0000,0000,0000,,如果我们移到4分 Dialogue: 0,0:04:34.69,0:04:38.85,Default,,0000,0000,0000,,我们看到评估分\N差一点达到8分 Dialogue: 0,0:04:38.85,0:04:41.08,Default,,0000,0000,0000,,这0.4的差异与我们之前 Dialogue: 0,0:04:41.08,0:04:45.74,Default,,0000,0000,0000,,用回归曲线公式\N计算出的差异相同 Dialogue: 0,0:04:46.06,0:04:48.95,Default,,0000,0000,0000,,请注意这个\N非常重要的警示 Dialogue: 0,0:04:49.24,0:04:50.91,Default,,0000,0000,0000,,我好像听起来在说 Dialogue: 0,0:04:50.91,0:04:54.48,Default,,0000,0000,0000,,高颜值会导致高的评估分 Dialogue: 0,0:04:54.48,0:04:56.61,Default,,0000,0000,0000,,但事实可能根本不是如此! Dialogue: 0,0:04:57.06,0:04:59.48,Default,,0000,0000,0000,,高颜值可能与高的评估分 Dialogue: 0,0:04:59.48,0:05:01.53,Default,,0000,0000,0000,,具有相关性 Dialogue: 0,0:05:01.94,0:05:05.38,Default,,0000,0000,0000,,但可能并不是\N评估分高的真正原因 Dialogue: 0,0:05:05.80,0:05:07.05,Default,,0000,0000,0000,,举个例子 Dialogue: 0,0:05:07.30,0:05:11.56,Default,,0000,0000,0000,,有些尽心尽责的老师\N在活跃课堂的同时 Dialogue: 0,0:05:11.56,0:05:14.40,Default,,0000,0000,0000,,也注重外表 Dialogue: 0,0:05:15.06,0:05:18.87,Default,,0000,0000,0000,,时髦的装束会\N导致颜值分高 Dialogue: 0,0:05:19.42,0:05:20.83,Default,,0000,0000,0000,,在这种情况下\N Dialogue: 0,0:05:20.83,0:05:25.68,Default,,0000,0000,0000,,我们看到颜值分\N与评估分之间成正相关 Dialogue: 0,0:05:25.68,0:05:29.90,Default,,0000,0000,0000,,但颜值的改变不会\N导致评估分发生变化 Dialogue: 0,0:05:30.52,0:05:32.26,Default,,0000,0000,0000,,这个例子再次提醒我们 Dialogue: 0,0:05:32.26,0:05:35.35,Default,,0000,0000,0000,,相关性不等于因果关系 Dialogue: 0,0:05:35.83,0:05:39.06,Default,,0000,0000,0000,,这是我们将在以后的视频中\N讨论的内容 Dialogue: 0,0:05:40.27,0:05:41.30,Default,,0000,0000,0000,,话虽如此 Dialogue: 0,0:05:41.30,0:05:43.96,Default,,0000,0000,0000,,还是让我们再做个练习\N巩固一下 Dialogue: 0,0:05:43.97,0:05:49.54,Default,,0000,0000,0000,,假设增加颜值确实\N会导致更高的评估分 Dialogue: 0,0:05:49.54,0:05:52.67,Default,,0000,0000,0000,,如果教授的颜值\N从2分变到7分 Dialogue: 0,0:05:52.67,0:05:55.33,Default,,0000,0000,0000,,评估分的预期变化是多少? Dialogue: 0,0:05:55.66,0:05:57.95,Default,,0000,0000,0000,,请用两种方法计算 Dialogue: 0,0:05:58.17,0:05:59.90,Default,,0000,0000,0000,,我会暂停一下 Dialogue: 0,0:05:59.90,0:06:01.54,Default,,0000,0000,0000,,当你做好答案后\N请回到视频 Dialogue: 0,0:06:01.54,0:06:02.68,Default,,0000,0000,0000,,♪ [音乐] ♪ Dialogue: 0,0:06:03.79,0:06:05.87,Default,,0000,0000,0000,,通过使用公式中的斜率 Dialogue: 0,0:06:05.87,0:06:08.21,Default,,0000,0000,0000,,或直接从回归线中读取数据 Dialogue: 0,0:06:08.21,0:06:09.91,Default,,0000,0000,0000,,你应该已经得出了 Dialogue: 0,0:06:09.91,0:06:11.82,Default,,0000,0000,0000,,评估分的变化值 Dialogue: 0,0:06:12.83,0:06:15.79,Default,,0000,0000,0000,,如果你做错了——\N没什么大不了的 Dialogue: 0,0:06:15.79,0:06:17.65,Default,,0000,0000,0000,,再试一次 Dialogue: 0,0:06:18.57,0:06:21.86,Default,,0000,0000,0000,,现在我们已经了解了线性方程 Dialogue: 0,0:06:21.86,0:06:24.63,Default,,0000,0000,0000,,特别是斜率的重要性 Dialogue: 0,0:06:25.14,0:06:26.42,Default,,0000,0000,0000,,在下一个视频中 Dialogue: 0,0:06:26.42,0:06:29.60,Default,,0000,0000,0000,,我们将研究异常值\N对线性回归的影响 Dialogue: 0,0:06:29.87,0:06:30.77,Default,,0000,0000,0000,,♪[音乐]♪ Dialogue: 0,0:06:31.62,0:06:32.88,Default,,0000,0000,0000,,- [讲解员] 祝贺你! Dialogue: 0,0:06:32.88,0:06:36.02,Default,,0000,0000,0000,,你离成为数据“忍者”\N又近了一步! Dialogue: 0,0:06:36.02,0:06:37.94,Default,,0000,0000,0000,,不过,要想熟练掌握所学内容 Dialogue: 0,0:06:37.94,0:06:39.60,Default,,0000,0000,0000,,你还需要做些习题\N Dialogue: 0,0:06:39.60,0:06:41.23,Default,,0000,0000,0000,,来磨练技艺\N Dialogue: 0,0:06:41.33,0:06:44.31,Default,,0000,0000,0000,,准备好迎接下一个挑战了吗?\N请点击“下一个视频” Dialogue: 0,0:06:44.31,0:06:48.84,Default,,0000,0000,0000,,♪ [音乐] ♪