Return to Video

Interpreting the Regression Line

  • 0:00 - 0:04
    ♪[音乐]♪
  • 0:11 - 0:14
    理解数据
  • 0:16 - 0:18
    - [Thomas Stratmann]
    让我们深入了解一下
  • 0:18 - 0:21
    线性回归的这条线
    告诉了我们什么信息
  • 0:21 - 0:24
    为此,让我先介绍一下
  • 0:24 - 0:27
    我们需要使用的数据工具
  • 0:27 - 0:28
    将页面向下滚动
  • 0:28 - 0:30
    在视频下方会看到此工具
  • 0:31 - 0:33
    除了观看本课程的视频
  • 0:34 - 0:37
    你可以按照自己的节奏
    来摆弄那些数据
  • 0:38 - 0:39
    让我快速带你们看一下
  • 0:40 - 0:42
    这里有几个选项标签
  • 0:42 - 0:45
    在这个视频中
    我们先涉及两个标签——
  • 0:45 - 0:48
    汇总统计标签
    和公式选项标签
  • 0:48 - 0:50
    如果你还记得
  • 0:50 - 0:53
    我们正在讨论老师的颜值
  • 0:53 - 0:56
    与学生给他们的评估分
    之间的关系
  • 0:57 - 1:00
    点击汇总统计标签
    图表展示一目了然:
  • 1:00 - 1:03
    数据中每个变量的值是多少
  • 1:03 - 1:05
    以及它们是如何分布的
  • 1:05 - 1:08
    例如,让我们来看一下
  • 1:08 - 1:10
    数据组中
    颜值分数的分布情况
  • 1:10 - 1:15
    在最高10分的情况下
    大部分人得了3分或4分
  • 1:15 - 1:16
    妈呀!
  • 1:16 - 1:20
    现在,让我们来看看
    评估分数的分布
  • 1:20 - 1:23
    对教授们来说
    这看起来好多了
  • 1:23 - 1:26
    因为很多人落在了高分段
  • 1:26 - 1:31
    如果你点击公式选项标签
    你会看到散点图
  • 1:31 - 1:33
    横轴上是颜值分数
  • 1:34 - 1:36
    纵轴上是评估分数
  • 1:37 - 1:39
    如果鼠标在
    任意一点悬停
  • 1:39 - 1:43
    你将看到那个老师的颜值分
  • 1:43 - 1:46
    和与之对应的评估分
  • 1:47 - 1:50
    你可以点击这里
    来添加回归线
  • 1:50 - 1:52
    为了更好地理解回归线
  • 1:52 - 1:55
    让我们花点儿时间
    回顾一下它的表达式
  • 1:55 - 1:59
    通常写为:y = b + mx
  • 1:59 - 2:02
    你可能在数学课上见过它
  • 2:03 - 2:05
    “x”被称为解释变量
  • 2:06 - 2:10
    在我们的数据组中
    x代表颜值分
  • 2:10 - 2:14
    我们用它来解释y的值
  • 2:14 - 2:16
    y又被称为“响应变量”
  • 2:17 - 2:21
    在我们的例子里
    就是学生给的评估分
  • 2:21 - 2:23
    所以,在颜值分发生变化时
  • 2:23 - 2:26
    学生评估分会随之变化
  • 2:27 - 2:29
    “b”通常被称为y轴截距
  • 2:30 - 2:32
    “m”是这条线的斜率
  • 2:33 - 2:38
    在线性回归中
    那个公式通常会写成这样:
  • 2:39 - 2:41
    响应变量
  • 2:41 - 2:43
    也就是学生给的评估分
  • 2:43 - 2:46
    等于y轴截距加上
  • 2:46 - 2:49
    斜率乘以解释变量
  • 2:50 - 2:51
    在这里便是颜值分
  • 2:52 - 2:55
    让我们在数据组中
    找出这些对应的值
  • 2:55 - 2:57
    让我们在这里停一下
  • 2:57 - 2:59
    请找出线性回归的
  • 2:59 - 3:01
    斜率和y-截距值
  • 3:01 - 3:03
    记下来,然后继续观看
  • 3:03 - 3:05
    ♪ [音乐] ♪
  • 3:05 - 3:07
    这是你要找的答案
  • 3:07 - 3:09
    你应该已经得出了
  • 3:09 - 3:11
    斜率和y轴截距的值了
  • 3:12 - 3:14
    通常,在线性回归中
  • 3:14 - 3:17
    我们关心的不是y轴截距
  • 3:17 - 3:20
    而是斜率的值
  • 3:20 - 3:22
    斜率告诉我们
  • 3:22 - 3:25
    当解释变量的值
    增加1个单位时
  • 3:25 - 3:28
    响应变量的值会向哪个方向
  • 3:28 - 3:31
    发生多大的变化
  • 3:32 - 3:36
    掌握了斜率的值
    我们可以做些好玩的事儿
  • 3:36 - 3:37
    例如——
  • 3:37 - 3:39
    如果把一个老师的颜值分
  • 3:39 - 3:42
    从2变到3会怎样呢?
  • 3:42 - 3:45
    她的评估分会提高多少?
  • 3:45 - 3:48
    我们可以从预测模型中
    直接估算出变化
  • 3:49 - 3:51
    我们把她的颜值分加了1分
  • 3:51 - 3:55
    很简单——
    评价分的变化等于斜率值 0.2
  • 3:55 - 3:57
    如果把她的颜值分提高一倍
  • 3:57 - 4:01
    从2增加4,又会如何呢?
  • 4:03 - 4:07
    现在,我们用
    解释变量的变化值2
  • 4:07 - 4:10
    乘以斜率0.2
  • 4:10 - 4:13
    求得评估分的预期变化值
  • 4:14 - 4:18
    所以,当一位老师的
    颜值分增加2个单位
  • 4:18 - 4:22
    我们预测她的
    评估分会提高0.4
  • 4:22 - 4:27
    我们可以通过阅读回归线
    得到同样的结果
  • 4:27 - 4:32
    如果从2分开始
    我们会看到评估分约为7.5分
  • 4:32 - 4:35
    如果我们移到4分
  • 4:35 - 4:39
    我们看到评估分
    差一点达到8分
  • 4:39 - 4:41
    这0.4的差异与我们之前
  • 4:41 - 4:46
    用回归曲线公式
    计算出的差异相同
  • 4:46 - 4:49
    请注意这个
    非常重要的警示
  • 4:49 - 4:51
    我好像听起来在说
  • 4:51 - 4:54
    高颜值会导致高的评估分
  • 4:54 - 4:57
    但事实可能根本不是如此!
  • 4:57 - 4:59
    高颜值可能与高的评估分
  • 4:59 - 5:02
    具有相关性
  • 5:02 - 5:05
    但可能并不是
    评估分高的真正原因
  • 5:06 - 5:07
    举个例子
  • 5:07 - 5:12
    有些尽心尽责的老师
    在活跃课堂的同时
  • 5:12 - 5:14
    也注重外表
  • 5:15 - 5:19
    时髦的装束会
    导致颜值分高
  • 5:19 - 5:21
    在这种情况下
  • 5:21 - 5:26
    我们看到颜值分
    与评估分之间成正相关
  • 5:26 - 5:30
    但颜值的改变不会
    导致评估分发生变化
  • 5:31 - 5:32
    这个例子再次提醒我们
  • 5:32 - 5:35
    相关性不等于因果关系
  • 5:36 - 5:39
    这是我们将在以后的视频中
    讨论的内容
  • 5:40 - 5:41
    话虽如此
  • 5:41 - 5:44
    还是让我们再做个练习
    巩固一下
  • 5:44 - 5:50
    假设增加颜值确实
    会导致更高的评估分
  • 5:50 - 5:53
    如果教授的颜值
    从2分变到7分
  • 5:53 - 5:55
    评估分的预期变化是多少?
  • 5:56 - 5:58
    请用两种方法计算
  • 5:58 - 6:00
    我会暂停一下
  • 6:00 - 6:02
    当你做好答案后
    请回到视频
  • 6:02 - 6:03
    ♪ [音乐] ♪
  • 6:04 - 6:06
    通过使用公式中的斜率
  • 6:06 - 6:08
    或直接从回归线中读取数据
  • 6:08 - 6:10
    你应该已经得出了
  • 6:10 - 6:12
    评估分的变化值
  • 6:13 - 6:16
    如果你做错了——
    没什么大不了的
  • 6:16 - 6:18
    再试一次
  • 6:19 - 6:22
    现在我们已经了解了线性方程
  • 6:22 - 6:25
    特别是斜率的重要性
  • 6:25 - 6:26
    在下一个视频中
  • 6:26 - 6:30
    我们将研究异常值
    对线性回归的影响
  • 6:30 - 6:31
    ♪[音乐]♪
  • 6:32 - 6:33
    - [讲解员] 祝贺你!
  • 6:33 - 6:36
    你离成为数据“忍者”
    又近了一步!
  • 6:36 - 6:38
    不过,要想熟练掌握所学内容
  • 6:38 - 6:40
    你还需要做些习题
  • 6:40 - 6:41
    来磨练技艺
  • 6:41 - 6:44
    准备好迎接下一个挑战了吗?
    请点击“下一个视频”
  • 6:44 - 6:49
    ♪ [音乐] ♪
Title:
Interpreting the Regression Line
Video Language:
English
Team:
Marginal Revolution University
Project:
Understanding Data
Duration:
06:51

Chinese, Simplified subtitles

Revisions Compare revisions